java读取unicode_java怎么样将unicode解码读取?Java读取本地文件进
发布日期:2021-06-24 16:15:26 浏览次数:4 分类:技术文章

本文共 1132 字,大约阅读时间需要 3 分钟。

package util;

import Java.nio.ByteBuffer;

import java.nio.charset.Charset;

import java.util.regex.Matcher;

import java.util.regex.Pattern;

/**

* @author tian

*

*/

public class CharSetUtil {

/**

* 解码 Unicode \\uXXXX

* @param str

* @return

*/

public static String decodeUnicode(String str) {

Charset set = Charset.forName("UTF-16");

Pattern p = Pattern.compile("\\\\u([0-9a-fA-F]{4})");

Matcher m = p.matcher( str );

int start = 0 ;

int start2 = 0 ;

StringBuffer sb = new StringBuffer();

while( m.find( start ) ) {

start2 = m.start() ;

if( start2 > start ){

String seg = str.substring(start, start2) ;

sb.append( seg );

}

String code = m.group( 1 );

int i = Integer.valueOf( code , 16 );

byte[] bb = new byte[ 4 ] ;

bb[ 0 ] = (byte) ((i >> 8) & 0xFF );

bb[ 1 ] = (byte) ( i & 0xFF ) ;

ByteBuffer b = ByteBuffer.wrap(bb);

sb.append( String.valueOf( set.decode(b) ).trim() );

start = m.end() ;

}

start2 = str.length() ;

if( start2 > start ){

String seg = str.substring(start, start2) ;

sb.append( seg );

}

return sb.toString() ;

}

public static void main(String[] args) {

System.out.println( decodeUnicode("\\u5907abbbbbs\\u5907"));

}

}

转载地址:https://blog.csdn.net/weixin_33758343/article/details/114306117 如侵犯您的版权,请留言回复原文章的地址,我们会给您删除此文章,给您带来不便请您谅解!

上一篇:java.io.file()_Java File getUsableSpace()方法
下一篇:java crc32 使用_Java CRC32的用法

发表评论

最新留言

关注你微信了!
[***.104.42.241]2024年04月03日 23时16分37秒