您的位置:首页 > 吉日

中文简繁体在线转换(繁简体在线转换)

中文简繁体在线转换(繁简体在线转换)

常用简繁字体互换

简繁字体

简繁体字对照表,收藏起来随时用

很多人创作时简繁体字混杂使用看起来很怪异,甚至因用字简繁之误而错失入展获奖良机。如果熟识了简繁体字表,就不会有这些遗憾了!先收藏,有时间随时看看吧。

一、繁体字大全

简化偏旁

讠[訁] 饣[飠] [昜] 纟[糹] [臤] 只[戠] 钅[釒] 呙[咼]

A爱[愛] 碍[礙] 肮[骯] 袄[襖]

B罢[罷] 备[備] 贝[貝] 笔[筆] 毕[畢] 边[邊] 宾[賓] 坝[壩] 板[闆] 办[辦] 帮[幫] 宝[寶] 报[報] 币[幣] 毙[斃] 标[標] 表[錶] 别[彆] 卜[蔔] 补[補]

C参[參] 仓[倉] 产[産] 长[長] 尝[嘗] 车[車] 齿[齒] 虫[蟲] 刍[芻] 从[從] 窜[竄] 才[纔] 蚕[蠶] 灿[燦] 层[層] 搀[攙] 谗[讒] 馋[饞] 缠[纏] 忏[懺] 偿[償] 厂[廠] 彻[徹] 尘[塵] 衬[襯] 称[稱] 惩[懲] 迟[遲] 冲[衝] 丑[醜] 出[齣] 础[礎] 处[處] 触[觸] 辞[辭] 聪[聰] 丛[叢]

D达[遌带[帶] 单[單] 当[當][噹] 党[黨] 东[東] 动[動] 断[斷] 对[對] 队[隊] 担[擔] 胆[膽] 导[導] 灯[燈] 邓[鄧] 敌[敵] 籴[糴] 递[遞] 点[點] 淀[澱] 电[電] 冬[鼕] 斗[鬥] 独[獨] 吨[噸] 夺[奪] 堕[墮]

E儿[兒] 尔[爾]

F发[發][髮] 丰[豐] 风[風] 矾[礬] 范[範] 飞[飛] 坟[墳] 奋[奮] 粪[糞] 凤[鳳] 肤[膚] 妇[婦] 复[復][複]

G冈[岡] 广[廣] 归[歸] 龟[龜] 国[國] 过[過] 盖[蓋] 干[乾][幹] 赶[趕] 个[個] 巩[鞏] 沟[溝] 构[構] 购[購] 谷[穀] 顾[顧] 刮[颳] 关[關] 观[觀] 柜[櫃]

H华[華] 画[畫] 汇[匯][彙] 会[會] 汉[漢] 号[號] 合[閤] 轰[轟] 后[後] 胡[鬍] 壶[壺] 沪[滬] 护[護] 划[劃] 怀[懷] 坏[壞] 欢[歡] 环[環] 还[還] 回[迴] 伙[夥] 获[獲][穫]

J几[幾] 夹[夾] 戋[戔] 监[監] 见[見] 荐[薦] 将[將] 节[節] 尽[盡][儘] 进[進] 举[舉] 击[擊] 鸡[鷄] 积[積] 极[極] 际[際] 继[繼] 家[傢] 价[價] 艰[艱] 歼[殲] 茧[繭] 拣[揀] 硷[鹼] 舰[艦] 姜[薑] 浆[漿] 桨[槳] 奖[奬] 讲[講] 酱[醬] 胶[膠] 阶[階] 疖[癤] 洁[潔] 借[藉] 仅[僅] 惊[驚] 竞[競] 旧[舊] 剧[劇] 据[據] 惧[懼] 卷[捲]

K壳[殼] 开[閉克[剋] 垦[墾] 恳[懇] 夸[誇] 块[塊] 亏[虧] 困[睏]

L来[來] 乐[樂] 离[離] 历[歷][曆] 丽[麗] 两[兩] 灵[靈] 刘[劉] 龙[龍] 娄[婁] 卢[盧] 虏[虜] 卤[鹵][滷] 录[録] 虑[慮] 仑[侖] 罗[羃腊[臘] 蜡[蠟] 兰[蘭] 拦[攔] 栏[欄] 烂[爛] 累[纍] 垒[壘] 类[類] 里[裏] 礼[禮] 隶[隸] 帘[簾] 联[聯] 怜[憐] 炼[煉] 练[練] 粮[糧] 疗[療] 辽[遼] 了[瞭] 猎[獵] 临[臨] 邻[鄰] 岭[嶺] 庐[廬] 芦[蘆] 炉[爐] 陆[陸] 驴[驢] 乱[亂]

M马[馬] 买[買] 卖[賣] 麦[麥] 门[門] 黾[黽] 么[麽] 霉[黴] 蒙[矇][濛][懞] 梦[夢] 面[麵] 庙[廟] 灭[滅] 蔑[衊] 亩[畝]

N难[難] 鸟[鳥] 聂[聶] 宁[寧] 农[農] 恼[惱] 脑[腦] 拟[擬] 酿[釀] 疟[瘧]

P盘[盤] 辟[闢] 苹[蘋] 凭[憑] 扑[撲] 仆[僕] 朴[樸]

Q齐[齊] 岂[豈] 气[氣] 迁[遷] 佥[僉] 乔[喬] 亲[親] 穷[窮] 区[區] 启[啓] 签[籤] 千[韆] 牵[牽] 纤[縴][纖] 窍[竅] 窃[竊] 寝[寢] 庆[慶] 琼[瓊] 秋[鞦] 曲[麯] 权[權] 劝[勸] 确[碷

R让[讓] 扰[擼热[熱] 认[認]

S啬[嗇] 杀[殺] 审[審] 圣[聖] 师[師] 时[時] 寿[壽] 属[屬] 双[雙] 肃[肅] 岁[歲] 孙[孫] 洒[灑] 伞[傘] 丧[喪] 扫[掃] 涩[澀] 晒[曬] 伤[傷] 舍[捨] 沈[瀋] 声[聲] 胜[勝] 湿[濕] 实[實] 适[適] 势[勢] 兽[獸] 书[書] 术[術] 树[樹] 帅[帥] 松[鬆] 苏[蘇][囌] 虽[雖] 随[隨]

T条[條] 台[臸[檯][颱] 态[態] 坛[壇][罎] 叹[嘆] 誊[謄] 体[體] 粜[糶] 铁[鐵] 听[聽] 厅[廳] 头[頭] 图[圖] 涂[塗] 团[團][糰] 椭[橢]

W万[萬] 为[爲] 韦[韋] 乌[烏] 无[無] 洼[窪] 袜[襪] 网[網] 卫[衛] 稳[穩] 务[務] 雾[霧]

X牺[犧] 习[習] 系[係][繫] 戏[戲] 虾[蝦] 吓[嚇] 咸[鹹] 显[顯] 宪[憲] 县[縣] 响[響] 向[嚮] 协[協] 胁[脅] 亵[褻] 衅[釁] 兴[興] 须[鬚] 悬[懸] 选[選] 旋[鏇] 献[獻] 乡[鄉] 写[寫] 寻[尋]

Y压[壓] 盐[鹽] 阳[陽] 养[養] 痒[癢] 样[樣] 钥[鑰] 药[藥] 爷[爺] 叶[葉] 医[醫] 亿[億] 忆[憶] 应[應] 痈[癰] 拥[擁] 佣[傭] 踊[踴] 忧[憂] 优[優] 邮[郵] 余[餘] 御[禦] 吁[籲] 郁[鬱] 誉[譽] 渊[淵] 园[園] 远[遠] 愿[願] 跃[躍] 运[運] 酝[醖] 亚[亞] 严[嚴] 厌[厭] 尧[堯] 业[業] 页[頁] 义[義] 艺[藝] 阴[陰] 隐[隱] 犹[猶] 鱼[魚] 与[與] 云[雲]

Z杂[雜] 赃[贜] 脏[臟][髒] 凿[鑿] 枣[棘] 灶[竈] 斋[齋] 毡[氈] 战[戰] 赵[趙] 折[摺] 这[這] 征[徵] 症[癥] 证[證] 只[隻][衹] 致[緻] 制[製] 钟[鐘][鍾] 肿[腫] 种[種] 众[衆] 昼[晝] 朱[硃] 烛[燭] 筑[築] 庄[莊] 桩[樁] 妆[妝] 装[裝] 壮[壯] 状[狀] 准[準] 浊[濁] 总[總] 钻[鑽] 郑[鄭] 执[執] 质[質] 专[專]

二、一对多繁体字

干:对应三个繁体字: (干)涉,(乾)燥,(幹)部

后:对应两个繁体字: (後)面,皇(后)

系:对应三个繁体字: 唔(系),關(係),聯(繫)

历:对应两个繁体字: (歷)史,日(曆)

钟:对应两个繁体字: 時(鐘),(鍾)意

板:对应两个繁体字:老(闆),木(板)

表:对应两个繁体字:手(錶),外(表)

丑:对应两个繁体字:(醜)怪,子(丑)寅卯

范:对应两个繁体字:模(範),(范)仲淹[注:姓氏]

丰:对应两个繁体字:(豐)富,(丰)采

刮:对应两个繁体字:(颳)風,搜(刮)

胡:对应两个繁体字:(鬍)須,(胡)闹,(胡)亂

回:对应两个繁体字:(迴)旋,(回)頭,(回)報,(回)族

伙:对应两个繁体字:(夥)計,團(夥),(伙)食,(伙)房

姜:对应两个繁体字:生(薑),(姜)子牙[注:姓氏]

借:对应两个繁体字:(藉)口,(藉)題發挥,(借)錢

克:对应两个繁体字:攻(剋),(剋)期,(克)勤(克)儉,千(克)

困:对应两个繁体字:(睏)倦,(睏)覺,(困)苦,圍(困)

漓:对应两个繁体字:(灕)江,淋(漓)

里:对应两个繁体字:表(裏)不一,這(裏),(里)程,鄰(里)關係

帘:对应两个繁体字:窗(簾),垂(簾)聽政,酒(帘)[注:旗子狀嘅標誌]

面:对应两个繁体字:(麵)粉,(麵)條,當(面),表(面),反(面)

蔑:对应两个繁体字:污(衊),(蔑)視

千:对应两个繁体字:鞦(韆)[注:簡體:秋千],一(千),(千)秋基业。

秋:对应两个繁体字:(鞦)韆,(秋)季

松:对应两个繁体字:(鬆)散,(松)樹

咸:对应两个繁体字:(鹹)菜,老少(咸)宜

向:对应两个繁体字:(嚮)前走,方(向)

余:对应两个繁体字:業(餘)愛好,(余)[注:第一人稱代詞,我]

郁:对应两个繁体字:(鬱)(鬱)?,濃(郁)

御:对应两个繁体字:抵(禦),(御)驾親征

愿:对应两个繁体字:(願)望,(願)意,許(願),

云:对应两个繁体字:(雲)彩,(雲)南省,子曰詩云

芸:对应两个繁体字:(蕓)薹,(芸)香

沄:对应两个繁体字:(澐)[注:大波浪],大江(沄)(沄)

致:对应两个繁体字:細(緻),(致)敬,(致)力

制:对应两个繁体字:節(制),(制)度,(製)造

朱:对应两个繁体字:(硃)[注:名詞:朱砂],(朱)紅色

筑:对应两个繁体字:建(築),(筑)[注:古代樂器]

准:对应两个繁体字:(準)則,瞄(準),(准)許

辟:对应两个繁体字:复(辟),開(闢),精(闢)

别:对应两个繁体字:告(別),(別)人,差(別),(彆)扭

卜:对应两个繁体字:占(卜),前程未(卜),蘿(蔔)

种:对应两个繁体字:(种)[注:姓],物(種)起源,(種)田

虫:对应两个繁体字:昆(蟲),毛(蟲),長(虫)[注:“虺”的本字,毒蛇]

党:对应两个繁体字:(党)項[注:姓氏],(黨)員

斗:对应两个繁体字:車載(斗)量,煙(斗),北(斗)星,(鬥)牛士,(鬥)智(鬥)勇

谷:对应两个繁体字:五(穀)雜糧,稻(穀),山(谷),進退維(谷)

划:对应两个繁体字:(划)船,(划)得来,刻(劃)

几:对应两个繁体字:茶(几),(幾)乎,(幾)個

家:对应两个繁体字:(傢)具,(傢)什,(家)庭,(家)乡,科学(家)

据:对应两个繁体字:占(據),(據)點,凭(據),拮(据)

卷:对应两个繁体字:風(捲)殘雲,讀書破萬(卷),試(卷)

蜡:对应两个繁体字:(蠟)燭,(蜡)[注:古代嘅一種年終祭祀]

了:对应两个繁体字:(了)卻,受不(了),(瞭)解、一目(瞭)然、不甚(瞭)(瞭)

累:对应两个繁体字:(纍)贅,罪行(纍)(纍),(纍)计,連(累)

勞(累)

朴:对应两个繁体字:(朴)刀,(樸)素

仆:对应两个繁体字:前(仆)后繼,(僕)人,公(僕)

曲:对应两个繁体字:彎(曲),戲(曲),(麯)酒

舍:对应两个繁体字:(捨)棄,施(捨),宿(舍)

胜:对应两个繁体字:(勝)利,名(勝),(胜)任

术:对应两个繁体字:技(術),苍(术)[注:中草藥],白(术)[注:中草藥]。

台:对应四个繁体字:1.天(台)[注:山名又地名],兄(台)[注:稱呼]

2.亭(臺)樓閣,舞(臺),3.寫字(檯)

4.(颱)風

体:对应两个繁体字:身(體),(体)夫[注:抬靈柩嘅人)

涂:对应两个繁体字:1.(涂)[注:水名

姓],(涂)月[注:農曆十二月],(涂)吾[注:水名(見《山海經?北山經》)]

2.生靈(塗)炭,(塗)改

吁:对应两个繁体字:長(吁)短歎,呼(籲)

佣:对应两个繁体字:雇(傭),(傭)人,(佣)金

折:对应两个繁体字:奏(摺),(摺)叠,曲(摺),(折)本,(折)斷

征:对应两个繁体字:遠(征),(徵)召,象(徵)

症:对应两个繁体字:(症)候,(癥)[注:腹中結塊之病]結

厂:对应两个繁体字:(厂)[注:多用于人名],工(廠)

广:对应两个繁体字:(广)[注:多用于人名],(廣)阔、(廣)東省

发:对应两个繁体字:(發)達,頭(髮)

复:对应两个繁体字:重(複),繁(複),(複)雜,(復)查,(復)習

汇:对应两个繁体字:(匯)合,(匯)款,(彙)聚,詞(彙)

获:对应两个繁体字:捕(獲),(獲)得,收(穫)

尽:对应两个繁体字:(儘)管,(盡)力,前功(盡)弃

苏:对应两个繁体字:紫(蘇),江(蘇),(蘇)维埃,(甦)醒

坛:对应两个繁体字:天(壇),花(壇),設(壇),論(壇),體(壇),(罎)(罎)罐罐,(罎)子

团:对应两个繁体字:(團)结,(團)體,師(團),(團)員,湯(糰),飯(糰)

须:对应两个繁体字:必(須),(須)知,胡(鬚)

脏:对应两个繁体字:肮(髒),內(臟),五(臟)六腑

只:对应两个繁体字:(隻)言片語,一(隻),(衹)不過,(衹)有

常用简繁字体互换

简繁字体

java 中文繁简体转换工具 opencc4j 使用介绍 1.8.0

Opencc4j

Opencc4j[1] 支持中文繁简体转换,考虑到词组级别。

在线体验[2]

Features 特点

严格区分「一简对多繁」和「一简对多异」。

完全兼容异体字,可以实现动态替换。

严格审校一简对多繁词条,原则为「能分则不合」。

词库和函数库完全分离,可以自由修改、导入、扩展。

兼容 Windows、Linux、Mac 平台。

支持自定义分词

支持判断单个字(词)是否为简体/繁体

支持返回字符串中简体/繁体的列表信息

支持中国台湾地区繁简体转换

v1.8.0 版本变更

丰富工具类方法

优化繁简体判断逻辑

变更日志[3]

创作缘由

•OpenCC

OpenCC[4] 的思想非常优秀,做的也特别棒。但是没有特别为 java 提供的工具。

•jopencc

jopencc[5] 没有提供分词功能。

快速开始maven 引入

<dependency><groupId>com.github.houbb</groupId><artifactId>opencc4j</artifactId><version>1.8.0</version></dependency>api 概览

核心工具列表如下:

| 序号 | 工具类 | 简介 |

|:---|:---|:---|

| 1 | ZhConverterUtil | 基础的繁简体转换 |

| 2 | ZhTwConverterUtil | 台湾地区的繁简体转换 |

所有的工具类方法具有相同的方法设计,便于记忆。

核心方法如下:

| 序号 | api 方法 | 简介 |

|:----|:----------------------------|:-----------------|

| 1 | toSimple(String) | 转为简体 |

| 2 | toTraditional(String) | 转为繁体 |

| 3 | simpleList(String) | 返回包含的简体列表 |

| 4 | traditionalList(String) | 返回包含的繁体列表 |

| 5 | toSimple(char) | 返回单个汉字对应的所有简体字列表 |

| 6 | toTraditional(char) | 返回单个汉字对应的所有繁体字列表 |

| 7 | isSimple(String) | 是否全部为简体 |

| 8 | isSimple(char) | 单个字符是否为简体 |

| 9 | containsSimple(String) | 字符中是否为包含简体 |

| 10 | isTraditional(String) | 是否全部为繁体 |

| 11 | isTraditional(char) | 单个字符是否为繁体 |

| 12 | containsTraditional(String) | 字符中是否为包含繁体 |

| 13 | isChinese(String) | 是否全部为中文 |

| 14 | isChinese(char) | 单个字符是否为中文 |

| 15 | containsChinese(char) | 字符串中是否包含中文 |

繁简体转换转为简体 toSimple

String original = "生命不息,奮鬥不止";String result = ZhConverterUtil.toSimple(original);Assert.assertEquals("生命不息,奋斗不止", result);转为繁体 toTraditional

String original = "生命不息,奋斗不止";String result = ZhConverterUtil.toTraditional(original);Assert.assertEquals("生命不息,奮鬥不止", result);繁简体判断

对单个字符或者词组进行繁简体判断。

是否为简体 isSimple

Assert.assertTrue(ZhConverterUtil.isSimple('奋'));Assert.assertTrue(ZhConverterUtil.isSimple("奋"));Assert.assertTrue(ZhConverterUtil.isSimple("奋斗"));Assert.assertFalse(ZhConverterUtil.isSimple('奮'));Assert.assertFalse(ZhConverterUtil.isSimple("奮"));Assert.assertFalse(ZhConverterUtil.isSimple("奮鬥"));Assert.assertFalse(ZhConverterUtil.isSimple("奮斗"));Assert.assertFalse(ZhConverterUtil.isSimple("beef"));是否包含简体 containsSimple

Assert.assertTrue(ZhConverterUtil.containsSimple("奋"));Assert.assertTrue(ZhConverterUtil.containsSimple("奋斗"));Assert.assertTrue(ZhConverterUtil.containsSimple("奋斗2023"));Assert.assertFalse(ZhConverterUtil.containsSimple("編"));Assert.assertFalse(ZhConverterUtil.containsSimple("編號"));是否为繁体 isTraditional

Assert.assertTrue(ZhConverterUtil.isTraditional('編'));Assert.assertTrue(ZhConverterUtil.isTraditional("編"));Assert.assertTrue(ZhConverterUtil.isTraditional("編號"));Assert.assertFalse(ZhConverterUtil.isTraditional('编'));Assert.assertFalse(ZhConverterUtil.isTraditional("编"));Assert.assertFalse(ZhConverterUtil.isTraditional("编号"));Assert.assertFalse(ZhConverterUtil.isTraditional("编號"));是否包含繁体 containsTraditional

Assert.assertTrue(ZhConverterUtil.containsTraditional("編"));Assert.assertTrue(ZhConverterUtil.containsTraditional("編號"));Assert.assertTrue(ZhConverterUtil.containsTraditional("編號2023"));Assert.assertFalse(ZhConverterUtil.containsTraditional("号"));Assert.assertFalse(ZhConverterUtil.containsTraditional("编号"));句子中包含的繁简体列表返回

返回字符串中繁简体对应的词、字列表,默认支持中文分词。

繁简体列表返回的词组和分词策略紧密相关。

简体列表 simpleList

final String original = "生命不息奋斗不止";final List<String> resultList = ZhConverterUtil.simpleList(original);Assert.assertEquals("[生, 命, 不, 息, 奋斗, 不, 止]", resultList.toString());繁体列表 traditionalList

PS: 很多字是同体字。

final String original = "生命不息奮鬥不止";final List<String> resultList = ZhConverterUtil.traditionalList(original);Assert.assertEquals("[生, 命, 不, 息, 奮, 鬥, 不, 止]", resultList.toString());单个汉字对应的繁简体列表繁体字列表

Assert.assertEquals("[幹, 乾, 干]", ZhConverterUtil.toTraditional('干').toString());Assert.assertEquals("[發, 髮]", ZhConverterUtil.toTraditional('发').toString());简体字列表

Assert.assertEquals("[测]", ZhConverterUtil.toSimple('測').toString());中文工具方法是否为中文 isChinese

Assert.assertTrue(ZhConverterUtil.isChinese("你"));Assert.assertTrue(ZhConverterUtil.isChinese("你好"));Assert.assertTrue(ZhConverterUtil.isChinese('你'));Assert.assertFalse(ZhConverterUtil.isChinese("你0"));Assert.assertFalse(ZhConverterUtil.isChinese("10"));Assert.assertFalse(ZhConverterUtil.isChinese('0'));Assert.assertFalse(ZhConverterUtil.isChinese(""));Assert.assertFalse(ZhConverterUtil.isChinese(null));是否包含中文 containsChinese

Assert.assertTrue(ZhConverterUtil.containsChinese("你"));Assert.assertTrue(ZhConverterUtil.containsChinese("你好"));Assert.assertTrue(ZhConverterUtil.containsChinese("你0"));Assert.assertFalse(ZhConverterUtil.containsChinese("10"));Assert.assertFalse(ZhConverterUtil.containsChinese(""));Assert.assertFalse(ZhConverterUtil.containsChinese(null));中国台湾繁简体转换工具类

为保证方法的一致性,引入 ZhTwConverterUtil 工具类,支持方法和 ZhConverterUtil 保持一致。

测试用例

简体到繁体:

String original = "使用互联网";String result = ZhTwConverterUtil.toTraditional(original);Assert.assertEquals("使用網際網路", result);

繁体到简体:

String original = "使用網際網路";String result = ZhTwConverterUtil.toSimple(original);Assert.assertEquals("使用互联网", result);配置引导类引导类说明

主要的可配置项包含了分词和数据集合。

二者都是可以配置,并且支持自定的。

默认配置

默认工具类等价于如下:

ZhConvertBootstrap.newInstance().segment(Segments.defaults()).dataMap(DataMaps.defaults());中国台湾地区配置

中国台湾地区配置等价于:

ZhConvertBootstrap.newInstance().segment(Segments.defaults()).dataMap(DataMaps.taiwan());中文分词策略系统内置分词方式

你可以通过 Segments 工具类获取系统内置的分词实现。

| 序号 | 方法 | 准确性 | 性能 | 备注 |

|:---|:---|:---|:---|:---|

| 1 | defaults() | 高 | 高 | 默认分词形式,暂时为 fastForward 策略 |

| 2 | fastForward() | 较高 | 高 | fast-forward 分词策略 |

| 3 | chars() | 低 | 高 | 将字符串转换为单个字符列表,一般不建议使用 |

| 4 | huaBan() | 高 | 一般 | 花瓣的结巴分词策略 |

花瓣结巴分词

花瓣结巴分词在使用时,需要自行引入结巴分词依赖。

<dependency><groupId>com.huaban</groupId><artifactId>jieba-analysis</artifactId><version>1.0.2</version></dependency>自定义

你有时候可能除了上述的两种分词方式,会有更加适合自己业务的分词实现。

Opencc4j 支持自定义分词实现,只需要实现分词接口 Segment[6]

•接口内容

public interface Segment {/*** 分词* @param original 原始信息* @return 分词后的列表*/List<String> seg(final String original);}测试代码自定义分词实现类

/*** 一个最简单的分词实现。* 注意:仅仅做演示,不可实际使用。*/public class FooSegment implements Segment {@Overridepublic List<String> seg(String original) {return Arrays.asList(original, "测试");}}分词测试

我们自定义的分词,直接在默认添加“测试”这样的信息。

final String original = "寥落古行宫,宫花寂寞红。白头宫女在,闲坐说玄宗。";final Segment segment = new FooSegment();final String result = ZhConvertBootstrap.newInstance().segment(segment).toTraditional(original);Assert.assertEquals("寥落古行宮,宮花寂寞紅。白頭宮女在,閒坐說玄宗。測試", result);数据接口自定义

不同的地区,对应的转换规则是不同的。

具体参考一下台湾地区的使用方式即可。

接口说明

IDataMap 的接口如下。

/*** 数据 map 接口* @author binbin.hou* @since 1.5.2*/public interface IDataMap {/*** 繁体=》简体 词组* @return 结果* @since 1.5.2*/Map<String, List<String>> tsPhrase();/*** 繁体=》简体 单个字* @return 结果* @since 1.5.2*/Map<String, List<String>> tsChar();/*** 简体=》繁体 词组* @return 结果* @since 1.5.2*/Map<String, List<String>> stPhrase();/*** 简体=》繁体 单个字* @return 结果* @since 1.5.2*/Map<String, List<String>> stChar();/*** 繁体字所有字符* @return 繁体字所有字符* @since 1.6.2*/Set<String> tChars();/*** 简体字所有字符* @return 繁体字所有字符* @since 1.8.0*/Set<String> sChars();}自定义说明

如果需要拓展对应的数据,建议继承原始的实现,然后添加额外的数据信息即可。

可以参考 中国台湾地区实现[7]

ps: 后续考虑引入更加简单的实现方式,比如基于文本拓展,不过可扩展性没有接口灵活。

技术鸣谢OpenCC

OpenCC[8] 提供的原始数据信息。

花瓣

jieba-analysis[9] 提供中文分词

Issues & Bugs

需求和 BUG[10] 在这里,欢迎提供宝贵的建议。

如果对您有帮助,欢迎 Star 鼓励作者。

NLP 开源矩阵

pinyin 汉字转拼音[11]

pinyin2hanzi 拼音转汉字[12]

segment 高性能中文分词[13]

opencc4j 中文繁简体转换[14]

nlp-hanzi-similar 汉字相似度[15]

word-checker 拼写检测[16]

sensitive-word 敏感词[17]

后期 Road-Map

数据字典插件化

考虑长文本分段,并行转换

References

[1] Opencc4j: https://github.com/houbb/opencc4j[2] 在线体验: https://houbb.github.io/opensource/opencc4j[3] 变更日志: CHANGELOG.md[4] OpenCC: https://github.com/BYVoid/OpenCC[5] jopencc: https://github.com/carlostse/jopencc[6] Segment: https://github.com/houbb/opencc4j/blob/master/src/main/java/com/github/houbb/opencc4j/support/segment/Segment.java[7] 中国台湾地区实现: https://github.com/houbb/opencc4j#%E4%B8%AD%E5%9B%BD%E5%8F%B0%E6%B9%BE%E5%9C%B0%E5%8C%BA%E9%85%8D%E7%BD%AE[8] OpenCC: https://github.com/BYVoid/OpenCC[9] jieba-analysis: https://github.com/huaban/jieba-analysis[10] 需求和 BUG: https://github.com/houbb/opencc4j/issues[11] pinyin 汉字转拼音: https://github.com/houbb/pinyin[12] pinyin2hanzi 拼音转汉字: https://github.com/houbb/pinyin2hanzi[13] segment 高性能中文分词: https://github.com/houbb/segment[14] opencc4j 中文繁简体转换: https://github.com/houbb/opencc4j[15] nlp-hanzi-similar 汉字相似度: https://github.com/houbb/nlp-hanzi-similar[16] word-checker 拼写检测: https://github.com/houbb/word-checker[17] sensitive-word 敏感词: https://github.com/houbb/sensitive-word

一个工具帮你10秒搞定简体转繁体

喜爱汉字文化的朋友们,是时候将你们的文字平添一份神秘与优雅!

让我向你们隆重介绍——简体转繁体工具!无论你是在写文章、发布社交媒体内容还是与华人朋友交流,这个工具都将成为你的绝佳助手。

只需简单几步,你的简体文字将瞬间变身华丽繁体,展现出传统中华文化的魅力。

体验一下,你将震撼于文字的变幻之美,感受到字里行间流淌的文化底蕴。

让我们一起借助简体转繁体工具,让文字时光回溯,开启一段华美的新旅程!

简体转繁体工具可以帮助用户在需要时快速地转换文字形式。

它适用于翻译、传统文化保护、中文输入法等场景,能够帮助用户更好地理解或处理繁体字。

打开半文鱼 - 工具大全 - 超实用的在线工具大全,在线工具箱 - www.banwenyu.com ,搜索“简体转繁体”即可获得神器;

简体转繁体使用流程如下:

你可以将需要转换的简体文字粘贴到输入框中,或者直接在输入框中手动输入简体文字,点击转换按钮或执行转换命令,工具将会将简体文字转换为对应的繁体文字。

你可以对结果进行进一步操作或保存。

使用示意:

常用简繁字体互换

简繁字体