Java获取汉字拼音的全拼和首拼实现代码分享

网友投稿 265 2023-07-31


Java获取汉字拼音的全拼和首拼实现代码分享

import java.util.Collections;

import java.util.Iterator;

import java.util.LinkedHashMap;

import java.util.Map;

/**

* 将汉字转化为全拼

*/

public class CnToSpell1 {

private static Map spellMap = null;

//存放生僻字和其拼音的Map

private static Map uncommonWordsMap = null;

static {

if (spellMap == null) {

spellMap = Collections.synchronizedMap(new LinkedHashMap(396)) ;

uncommonWordsMap = Collections.synchronizedMap(new LinkedHashMap(200)) ;

}

initialize();

initUncommonWords();

}

private CnToSpell1() {}

/**

* 初始化

*/

private static void initialize() {

spellMap.put("'a", -20319);

spellMap.put("'ai", -20317);

spellMap.put("'an", -20304);

spellMap.put("'ang", -20295);

spellMap.put("'ao", -20292);

spellMap.put("ba", -20283);

spellMap.put("bai", -20265);

spellMap.put("ban", -20257);

spellMap.put("bang", -20242);

spellMap.put("bao", -20230);

spellMap.put("bei", -20051);

spellMap.put("ben", -20036);

spellMap.put("beng", -20032);

spellMap.put("bi", -20026);

spellMap.put("bian", -20002);

spellMap.put("biao", -19990);

spellMap.put("bie", -19986);

spellMap.put("bin", -19982);

spellMap.put("bing", -19976);

spellMap.put("bo", -19805);

spellMap.put("bu", -19784);

spellMap.put("ca", -19775);

spellMap.put("cai", -19774);

spellMap.put("can", -19763);

spellMap.put("cang", -19756);

spellMap.put("cao", -19751);

spellMap.put("ce", -19746);

spellMap.put("ceng", -19741);

spellMap.put("cha", -19739);

spellMap.put("chai", -19728);

spellMap.put("chan", -19725);

spellMap.put("chang", -19715);

spellMap.put("chao", -19540);

spellMap.put("che", -19531);

spellMap.put("chen", -19525);

spellMap.put("cheng", -19515);

spellMap.put("chi", -19500);

spellMap.put("chong", -19484);

spellMap.put("chou", -19479);

spellMap.put("chu", -19467);

spellMap.put("chuai", -19289);

spellMap.put("chuan", -19288);

spellMap.put("chuang", -19281);

spellMap.put("chui", -19275);

spellMap.put("chun", -19270);

spellMap.put("chuo", -19263);

spellMap.put("ci", -19261);

spellMap.put("cong", -19249);

spellMap.put("cou", -19243);

spellMap.put("cu", -19242);

spellMap.put("cuan", -19238);

spellMap.put("cui", -19235);

spellMap.put("cun", -19227);

spellMap.put("cuo", -19224);

spellMap.put("da", -19218);

spellMap.put("dai", -19212);

spellMap.put("dan", -19038);

spellMap.put("dang", -19023);

spellMap.put("dao", -19018);

spellMap.put("de", -19006);

spellMap.put("deng", -19003);

spellMap.put("di", -18996);

spellMap.put("dian", -18977);

spellMap.put("diao", -18961);

spellMap.put("die", -18952);

spellMap.put("ding", -18783);

spellMap.put("diu", -18774);

spellMap.put("dong", -18773);

spellMap.put("dou", -18763);

spellMap.put("du", -18756);

spellMap.put("duan", -18741);

spellMap.put("dui", -18735);

spellMap.put("dun", -18731);

spellMap.put("duo", -18722);

spellMap.put("'e", -18710);

spellMap.put("'en", -18697);

spellMap.put("'er", -18696);

spellMap.put("fa", -18526);

spellMap.put("fan", -18518);

spellMap.put("fang", -18501);

spellMap.put("fei", -18490);

spellMap.put("fen", -18478);

spellMap.put("feng", -18463);

spellMap.put("fo", -18448);

spellMap.put("fou", -18447);

spellMap.put("fu", -18446);

spellMap.put("ga", -18239);

spellMap.put("gai", -18237);

spellMap.put("gan", -18231);

spellMap.put("gang", -18220);

spellMap.put("gao", -18211);

spellMap.put("ge", -18201);

spellMap.put("gei", -18184);

spellMap.put("gen", -18183);

spellMap.put("geng", -18181);

spellMap.put("gong", -18012);

spellMap.put("gou", -17997);

spellMap.put("gu", -17988);

spellMap.put("gua", -17970);

spellMap.put("guai", -17964);

spellMap.put("guan", -17961);

spellMap.put("guang", -17950);

spellMap.put("gui", -17947);

spellMap.put("gun", -17931);

spellMap.put("guo", -17928);

spellMap.put("ha", -17922);

spellMap.put("hai", -17759);

spellMap.put("han", -17752);

spellMap.put("hang", -17733);

spellMap.put("hao", -17730);

spellMap.put("he", -17721);

spellMap.put("hei", -17703);

spellMap.put("hen", -17701);

spellMap.put("heng", -17697);

spellMap.put("hong", -17692);

spellMap.put("hou", -17683);

spellMap.put("hu", -17676);

spellMap.put("hua", -17496);

spellMap.put("huai", -17487);

spellMap.put("huan", -17482);

spellMap.put("huang", -17468);

spellMap.put("hui", -17454);

spellMap.put("hun", -17433);

spellMap.put("huo", -17427);

spellMap.put("ji", -17417);

spellMap.put("jia", -17202);

spellMap.put("jian", -17185);

spellMap.put("jiang", -16983);

spellMap.put("jiao", -16970);

spellMap.put("jie", -16942);

spellMap.put("jin", -16915);

spellMap.put("jing", -16733);

spellMap.put("jiong", -16708);

spellMap.put("jiu", -16706);

spellMap.put("ju", -16689);

spellMap.put("juan", -16664);

spellMap.put("jue", -16657);

spellMap.put("jun", -16647);

spellMap.put("ka", -16474);

spellMap.put("kai", -16470);

spellMap.put("kan", -16465);

spellMap.put("kang", -16459);

spellMap.put("kao", -16452);

spellMap.put("ke", -16448);

spellMap.put("ken", -16433);

spellMap.put("keng", -16429);

spellMap.put("kong", -16427);

spellMap.put("kou", -16423);

spellMap.put("ku", -16419);

spellMap.put("kua", -16412);

spellMap.put("kuai", -16407);

spellMap.put("kuan", -16403);

spellMap.put("kuang", -16401);

spellMap.put("kui", -16393);

spellMap.put("kun", -16220);

spellMap.put("kuo", -16216);

spellMap.put("la", -16212);

spellMap.put("lai", -16205);

spellMap.put("lan", -16202);

spellMap.put("lang", -16187);

spellMap.put("lao", -16180);

spellMap.put("le", -16171);

spellMap.put("lei", -16169);

spellMap.put("leng", -16158);

spellMap.put("li", -16155);

spellMap.put("lia", -15959);

spellMap.put("lian", -15958);

spellMap.put("liang", -15944);

spellMap.put("liao", -15933);

spellMap.put("lie", -15920);

spellMap.put("lin", -15915);

spellMap.put("ling", -15903);

spellMap.put("liu", -15889);

spellMap.put("long", -15878);

spellMap.put("lou", -15707);

spellMap.put("lu", -15701);

spellMap.put("lv", -15681);

spellMap.put("luan", -15667);

spellMap.put("lue", -15661);

spellMap.put("lun", -15659);

spellMap.put("luo", -15652);

spellMap.put("ma", -15640);

spellMap.put("mai", -15631);

spellMap.put("man", -15625);

spellMap.put("mang", -15454);

spellMap.put("mao", -15448);

spellMap.put("me", -15436);

spellMap.put("mei", -15435);

spellMap.put("men", -15419);

spellMap.put("meng", -15416);

spellMap.put("mi", -15408);

spellMap.put("mian", -15394);

spellMap.put("miao", -15385);

spellMap.put("mie", -15377);

spellMap.put("min", -15375);

spellMap.put("ming", -15369);

spellMap.put("miu", -15363);

spellMap.put("mo", -15362);

spellMap.put("mou", -15183);

spellMap.put("mu", -15180);

spellMap.put("na", -15165);

spellMap.put("nai", -15158);

spellMap.put("nan", -15153);

spellMap.put("nang", -15150);

spellMap.put("nao", -15149);

spellMap.put("ne", -15144);

spellMap.put("nei", -15143);

spellMap.put("nen", -15141);

spellMap.put("neng", -15140);

spellMap.put("ni", -15139);

spellMap.put("nian", -15128);

spellMap.put("niang", -15121);

spellMap.put("niao", -15119);

spellMap.put("nie", -15117);

spellMap.put("nin", -15110);

spellMap.put("ning", -15109);

spellMap.put("niu", -14941);

spellMap.put("nong", -14937);

spellMap.put("nu", -14933);

spellMap.put("nv", -14930);

spellMap.put("nuan", -14929);

spellMap.put("nue", -14928);

spellMap.put("nuo", -14926);

spellMap.put("'o", -14922);

spellMap.put("'ou", -14921);

spellMap.put("pa", -14914);

spellMap.put("pai", -14908);

spellMap.put("pan", -14902);

spellMap.put("pang", -14894);

spellMap.put("pao", -14889);

spellMap.put("pei", -14882);

spellMap.put("pen", -14873);

spellMap.put("peng", -14871);

spellMap.put("pi", -14857);

spellMap.put("pian", -14678);

spellMap.put("piao", -14674);

spellMap.put("pie", -14670);

spellMap.put("pin", -14668);

spellMap.put("ping", -14663);

spellMap.put("po", -14654);

spellMap.put("pu", -14645);

spellMap.put("qi", -14630);

spellMap.put("qia", -14594);

spellMap.put("qian", -14429);

spellMap.put("qiang", -14407);

spellMap.put("qiao", -14399);

spellMap.put("qie", -14384);

spellMap.put("qin", -14379);

spellMap.put("qing", -14368);

spellMap.put("qiong", -14355);

spellMap.put("qiu", -14353);

spellMap.put("qu", -14345);

spellMap.put("quan", -14170);

spellMap.put("que", -14159);

spellMap.put("qun", -14151);

spellMap.put("ran", -14149);

spellMap.put("rang", -14145);

spellMap.put("rao", -14140);

spellMap.put("re", -14137);

spellMap.put("ren", -14135);

spellMap.put("reng", -14125);

spellMap.put("ri", -14123);

spellMap.put("rong", -14122);

spellMap.put("rou", -14112);

spellMap.put("ru", -14109);

spellMap.put("ruan", -14099);

spellMap.put("rui", -14097);

spellMap.put("run", -14094);

spellMap.put("ruo", -14092);

spellMap.put("sa", -14090);

spellMap.put("sai", -14087);

spellMap.put("san", -14083);

spellMap.put("sang", -13917);

spellMap.put("sao", -13914);

spellMap.put("se", -13910);

spellMap.put("sen", -13907);

spellMap.put("seng", -13906);

spellMap.put("sha", -13905);

spellMap.put("shai", -13896);

spellMap.put("shan", -13894);

spellMap.put("shang", -13878);

spellMap.put("shao", -13870);

spellMap.put("she", -13859);

spellMap.put("shen", -13847);

spellMap.put("sheng", -13831);

spellMap.put("shi", -13658);

spellMap.put("shou", -13611);

spellMap.put("shu", -13601);

spellMap.put("shua", -13406);

spellMap.put("shuai", -13404);

spellMap.put("shuan", -13400);

spellMap.put("shuang", -13398);

spellMap.put("shui", -13395);

spellMap.put("shun", -13391);

spellMap.put("shuo", -13387);

spellMap.put("si", -13383);

spellMap.put("song", -13367);

spellMap.put("sou", -13359);

spellMap.put("su", -13356);

spellMap.put("suan", -13343);

spellMap.put("sui", -13340);

spellMap.put("sun", -13329);

spellMap.put("suo", -13326);

spellMap.put("ta", -13318);

spellMap.put("tai", -13147);

spellMap.put("tan", -13138);

spellMap.put("tang", -13120);

spellMap.put("tao", -13107);

spellMap.put("te", -13096);

spellMap.put("teng", -13095);

spellMap.put("ti", -13091);

spellMap.put("tian", -13076);

spellMap.put("tiao", -13068);

spellMap.put("tie", -13063);

spellMap.put("ting", -13060);

spellMap.put("tong", -12888);

spellMap.put("tou", -12875);

spellMap.put("tu", -12871);

spellMap.put("tuan", -12860);

spellMap.put("tui", -12858);

spellMap.put("tun", -12852);

spellMap.put("tuo", -12849);

spellMap.put("wa", -12838);

spellMap.put("wai", -12831);

spellMap.put("wan", -12829);

spellMap.put("wang", -12812);

spellMap.put("wei", -12802);

spellMap.put("wen", -12607);

spellMap.put("weng", -12597);

spellMap.put("wo", -12594);

spellMap.put("wu", -12585);

spellMap.put("xi", -12556);

spellMap.put("xia", -12359);

spellMap.put("xian", -12346);

spellMap.put("xiang", -12320);

spellMap.put("xiao", -12300);

spellMap.put("xie", -12120);

spellMap.put("xin", -12099);

spellMap.put("xing", -12089);

spellMap.put("xiong", -12074);

spellMap.put("xiu", -12067);

spellMap.put("xu", -12058);

spellMap.put("xuan", -12039);

spellMap.put("xue", -11867);

spellMap.put("xun", -11861);

spellMap.put("ya", -11847);

spellMap.put("yan", -11831);

spellMap.put("yang", -11798);

spellMap.put("yao", -11781);

spellMap.put("ye", -11604);

spellMap.put("yi", -11589);

spellMap.put("yin", -11536);

spellMap.put("ying", -11358);

spellMap.put("yo", -11340);

spellMap.put("yong", -11339);

spellMap.put("you", -11324);

spellMap.put("yu", -11303);

spellMap.put("yuan", -11097);

spellMap.put("yue", -11077);

spellMap.put("yun", -11067);

spellMap.put("za", -11055);

spellMap.put("zai", -11052);

spellMap.put("zan", -11045);

spellMap.put("zang", -11041);

spellMap.put("zao", -11038);

spellMap.put("ze", -11024);

spellMap.put("zei", -11020);

spellMap.put("zen", -11019);

spellMap.put("zeng", -11018);

spellMap.put("zha", -11014);

spellMap.put("zhai", -10838);

spellMap.put("zhan", -10832);

spellMap.put("zhang", -10815);

spellMap.put("zhao", -10800);

spellMap.put("zhe", -10790);

spellMap.put("zhen", -10780);

spellMap.put("zheng", -10764);

spellMap.put("zhi", -10587);

spellMap.put("zhong", -10544);

spellMap.put("zhou", -10533);

spellMap.put("zhu", -10519);

spellMap.put("zhua", -10331);

spellMap.put("zhuai", -10329);

spellMap.put("zhuan", -10328);

spellMap.put("zhuang", -10322);

spellMap.put("zhui", -10315);

spellMap.put("zhun", -10309);

spellMap.put("zhuo", -10307);

spellMap.put("zi", -10296);

http:// spellMap.put("zong", -10281);

spellMap.put("zou", -10274);

spellMap.put("zu", -10270);

spellMap.put("zuan", -10262);

spellMap.put("zui", -10260);

spellMap.put("zun", -10256);

spellMap.put("zuo", -10254);

}

/**

* 添加生僻字

* @param cnWord 生僻字

* @param spell 生僻字的拼音, 如果拼音以 a, o ,e 开头, 请将开头分别改为 'a, 'o, 'e, 如:安('an)

*/

public static void putUncommonWord(char cnWord, String spell){

uncommonWordsMap.put(cnWord, spell);

}

/**

* 初始化生僻字

*/

private static void initUncommonWords(){

putUncommonWord('奡', "ao");

putUncommonWord('灞', "ba");

putUncommonWord('犇', "ben");

putUncommonWord('猋', "biao");

putUncommonWord('骉', "biao");

putUncommonWord('杈', "cha");

putUncommonWord('棽', "chen");

putUncommonWord('琤', "cheng");

putUncommonWord('魑', "chi");

putUncommonWord('蟲', "chonghttp://");

putUncommonWord('翀', "chong");

putUncommonWord('麤', "cu");

putUncommonWord('毳', "cui");

putUncommonWord('昉', "fang");

putUncommonWord('沣', "feng");

putUncommonWord('玽', "gou");

putUncommonWord('焓', "han");

putUncommonWord('琀', "han");

putUncommonWord('晗', "han");

putUncommonWord('浛', "han");

putUncommonWord('翮', "he");

putUncommonWord('翯', "he");

putUncommonWord('嬛', "huan");

putUncommonWord('翙', "hui");

putUncommonWord('劼', "jie");

putUncommonWord('璟', "jing");

putUncommonWord('誩', "jing");

putUncommonWord('競', "jing");

putUncommonWord('焜', "kun");

putUncommonWord('琨', "kun");

putUncommonWord('鹍', "kun");

putUncommonWord('骊', "li");

putUncommonWord('鎏', "liu");

putUncommonWord('嫚', "man");

putUncommonWord('槑', "mei");

putUncommonWord('淼', "miao");

putUncommonWord('婻', "nan");

putUncommonWord('暔', "nan");

putUncommonWord('甯', "ning");

putUncommonWord('寗', "ning");

putUncommonWord('掱', "pa");

putUncommonWord('玭', "pi");

putUncommonWord('汧', "qian");

putUncommonWord('骎', "qin");

putUncommonWord('甠', "qing");

putUncommonWord('暒', "qing");

putUncommonWord('凊', "qing");

putUncommonWord('郬', "qing");

putUncommonWord('靘', "qing");

putUncommonWord('悫', "que");

putUncommonWord('慤', "que");

putUncommonWord('瑢', "rong");

putUncommonWord('珅', "shen");

putUncommonWord('屾', "shen");

putUncommonWord('燊', "shen");

putUncommonWord('焺', "sheng");

putUncommonWord('珄', "sheng");

putUncommonWord('晟', "sheng");

putUncommonWord('昇', "sheng");

putUncommonWord('眚', "sheng");

putUncommonWord('湦', "sheng");

putUncommonWord('陹', "sheng");

putUncommonWord('竔', "sheng");

putUncommonWord('琞', "sheng");

putUncommonWord('湜', "shi");

putUncommonWord('甦', "su");

putUncommonWord('弢', "tao");

putUncommonWord('瑱', "tian");

putUncommonWord('仝', "tong");

putUncommonWord('烓', "wei");

putUncommonWord('炜', "wei");

putUncommonWord('玮', "wei");

putUncommonWord('沕', "wu");

putUncommonWord('邬', "wu");

putUncommonWord('晞', "xi");

putUncommonWord('顕', "xian");

putUncommonWord('婋', "xiao");

putUncommonWord('虓', "xiao");

putUncommonWord('筱', "xiao");

putUncommonWord('勰', "xie");

putUncommonWord('忻', "xin");

putUncommonWord('庥', "xiu");

putUncommonWord('媭', "xu");

putUncommonWord('珝', "xu");

putUncommonWord('昫', "xu");

putUncommonWord('烜', "xuan");

putUncommonWord('煊', "xuan");

putUncommonWord('翾', "xuan");

putUncommonWord('昍', "xuan");

putUncommonWord('暄', "xuan");

putUncommonWord('娅', "ya");

putUncommonWord('琰', "yan");

putUncommonWord('妍', "yan");

putUncommonWord('焱', "yan");

putUncommonWord('玚', "yang");

putUncommonWord('旸', "yang");

putUncommonWord('飏', "yang");

putUncommonWord('垚', "yao");

putUncommonWord('峣', "yao");

putUncommonWord('怡', "yi");

putUncommonWord('燚', "yi");

putUncommonWord('晹', "yi");

putUncommonWord('祎', "yi");

putUncommonWord('瑛', "ying");

putUncommonWord('煐', "ying");

putUncommonWord('媖', "ying");

putUncommonWord('暎', "ying");

putUncommonWord('滢', "ying");

putUncommonWord('锳', "ying");

putUncommonWord('莜', "you");

putUncommonWord('昱', "yu");

putUncommonWord('沄', "yun");

putUncommonWord('晢', "zhe");

putUncommonWord('喆', "zhe");

putUncommonWord('臸', "zhi");

}

/**

* 获得单个汉字的Ascii.

* @param cn 汉字字符

* @return 汉字对应的 ascii, 错误时返回 0

*/

public static int getCnAscii(char cn) {

byte[] bytes = (String.valueOf(cn)).getBytes();

if (bytes == null || bytes.length == 0|| bytes.length > 2 ) { // 错误

return 0;

}

if (bytes.length == 1) { // 英文字符

return bytes[0];

}

if (bytes.length == 2) { // 中文字符

int hightByte = 256 + bytes[0];

int lowByte = 256 + bytes[1];

return (256 * hightByte + lowByte) - 256 * 256; //返回 ASCII

}

return 0; // 错误

}

/**

* 根据ASCII码到SpellMap中查找对应的拼音

* @param ascii ASCII

* @return ascii对应的拼音, 如果ascii对应的字符为单字符,则返回对应的单字符, 如果不是单字符且在 spellMap 中没找到对应的拼音,则返回空字符串(""),

*/

public static String getSpellByAscii(int ascii) {

if (ascii > 0 && ascii < 160) { // 单字符

return String.valueOf((char) ascii);

}

if (ascii < -20319 || ascii > -10247) { // 不知道的字符

return "";

}

String spell = null; //key

Integer asciiRang; //value

String spellPrevious = null; //用来保存上次轮循环的key

int asciiRangPrevious = -20319; //用来保存上一次循环的value

for (Iterator it = spellMap.keySet().iterator(); it.hasNext();) {

spell = (String) it.next(); //拼音

asciiRang = spellMap.get(spell); //拼音的ASCII

if(asciiRang != null){

if (ascii >= asciiRangPrevious && ascii < asciiRang) { // 区间找到, 返回对应的拼音

return (spellPrevious == null) ? spell : spellPrevious;

} else {

spellPrevious = spell;

asciiRangPrevious = asciiRang;

}

}

}

return "";

}

/**

* 获取字符串的全拼或首拼,是汉字则转化为对应的拼音或拼音首字母,其它字符不进行转换

* @param cnStr 要获取全拼或首拼的字符串

* @param onlyFirstSpell 是否只获取首拼,为true时,只获取首拼,为false时,获取全拼

* @return String cnStr的全拼或首拼, 如果 cnStr 为null 时, 返回""

*/

public static String getSpell(String cnStr, boolean onlyFirstSpell) {

if (cnStr == null) {

return "";

}

char[] chars = cnStr.trim().toCharArray();

StringBuffer sb = new StringBuffer();

for (int i = 0, len = chars.length; i < len; i++) {

int ascii = getCnAscii(chars[i]);

if (ascii == 0){ //如果获取汉字的ASCII出错,则不进行转换

sb.append(chars[i]);

}else{

String spell = getSpellByAscii(ascii); //根据ASCII取拼音

if(spell == null || spell.length() == 0){ //如果根据ASCII取拼音没取到,则到生僻字Map中取

spell = uncommonWordsMap.get(chars[i]);

}

if(spell == null || spell.length() == 0){ //如果没有取到对应的拼音,则不做转换,追加原字符

spell = uncommonWordsMap.get(chars[i]);

}else{

if(onlyFirstSpell){

sb.append(spell.startsWith("'") ? spell.substring(1, 2) : spell.substring(0, 1));

}else{

sb.append(spell);

}

}

}

} // end of for

return sb.toString();

}

public static void main(String[] args) {

String[] s = {"获取汉字全拼和首拼测试","This is a test","a,b; c[d]","标,点。","圆角数字123,特殊符号¥%——……", "繁体字:西安會議", "西安", "棽 燊 顕 峣 山 "};

for (int i = 0; i < s.length; i++) {

long l1 = System.currentTimeMillis();

System.out.println(s[i]+" 的全拼:" + getSpell(s[i], false));

System.out.println(s[i]+" 的首拼:" + getSpell(s[i], true));

System.out.println("获取全拼和首拼共用了"+(System.currentTimeMillis()-l1)+"毫秒/n");

}

}

}


版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:Java中使用正则表达式获取网页中所有图片的路径
下一篇:在CentOS系统中检测Java安装及运行jar应用的方法
相关文章

 发表评论

暂时没有评论,来抢沙发吧~