Skip to content

kfcd/hyzd

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

1 Commit
 
 
 
 
 
 
 
 

Repository files navigation

開放漢語字典

說明

本項目提供開放詞典網漢語字典的完整數據,並以繁簡兩種字體、漢語拼音、注音符號、威妥瑪等13種拼音方案、以及TSV、CSV、MD等多種文檔格式發佈,以便於人與機器皆能讀取、利用數據創造出衍生作品。

特色

  • 按照描寫語言學的原則編寫的漢語字典
  • 包含普通話(以《新華字典》為準)和國語(以《重編國語辭典修訂本》為準)兩種發音、用詞、和術語
  • 以漢語母語者實際講的語言為標準
  • 著重於現代漢語而非文言文(即現代語言為主,文言文為副)
  • 儘量為破音字、異體字等容易混淆的字區分、辨析、舉例
  • 完全開源/開放授權的語料數據

數據格式

繁體 簡體 拼音 詞例 定義 又作
suo1 蓑衣 用草或棕製作的雨衣
xun1 壎篪相和 一種古代吹奏樂器

同形不同音的字分為兩詞條。只有一項字義才有異體字的字亦分行處理,如:

繁體 簡體 拼音 詞例 定義 又作
cai2 方才,剛才 剛剛
cai2 才能,天才 能力
繁體 簡體 拼音 詞例 定義 又作
duk9 du2 讀書,閱讀 (動詞)看書
dau6 dou4 句讀 (古)文章裡停頓的地方

當拼音欄出現多於一個發音時,一般前者為普通話標準發音,而後者為國語標準發音,如:

繁體 簡體 拼音
ci4/si4
jiu1/jiu4
kai3/kai4
qi1/qi2

支援拼音方案

原數據採用漢語拼音標音,此外一共13種拼音版本(如注音符號)分別在dist/tsv等子目錄裡可找到。

  • 漢語拼音
    • (數字)如:han4、yu3、zi4、dian3
    • (調符)如:hàn、yǔ、zì、diǎn
  • 注音符號
    • 如:ㄏㄢˋ、ㄩˇ、ㄗˋ、ㄉㄧㄢˇ
  • 威妥瑪拼音
    • 如:han⁴、yü³、tzu⁴、tien³
  • 注音二式
    • 如:han4、yu3、tz4、dian3
  • 耶魯拼音
    • 如:hàn、yǔ、dz`、dyǎn
  • 通用拼音
    • 如:hanˋ、yuˇ、zihˋ、dianˇ
  • 國語羅馬字
    • 如:hann、yeu、tzyh、dean
  • 國際音標
    • 如:xan˥˩、y˨˩˦、tsɯ˥˩、tjɛn˨˩˦
  • 拼聲拼音
    • 如:Han、yu、Zi、dian
  • 俄文拼音
    • 如:хань⁴、юй³、цзы⁴、дянь³
  • 漢字(範例)
    • (繁體)如:汗⁴、于³、子⁴、典³
    • (繁體)如:汗⁴、于³、子⁴、典³

實現示例

  • 國粵消歧義字譜
  • 國粵字音對照表

另見

版權

© 2009-2020 開放詞典

本倉庫所含數據皆依照共享創意(創用CC/知識共享)姓名標示(署名)協議發佈。

創用 CC 授權條款
本著作係採用創用 CC 姓名標示 3.0 未本地化 授權條款授權。