現在位置 首頁>檢索服務>詳目式

全文限國圖網域開放

博碩士論文: 客家語拼音存取技術之研究

  • 作者:許義淵(研究生)
  • 其他作者:謝建成(指導教授)
  • 語文:中文
  • 出版者:國立臺灣師範大學
  • 系所名稱:圖書資訊學研究所在職進修碩士班
  • 學位類別:碩士
  • 出版日期:2007
  • 畢業學年度:96
  • 頁數:65
    • 主題:語言-其他
    • 關鍵詞:中國餘數定理、赫序、負載係數、客家語、Chinese remainder theorem、hash、loading factor、Hakka dialect
    • 國家:臺灣

    摘要:

    拼音存取技術依賴的是一套能夠快速將聲母、韻母、聲調等關鍵字集快速轉換到相對應字元的方法,目前最快速的搜尋方法是赫序(Hash)法則,只要透過相關的數學函數運算,馬上可以找到相對字元的位址。本文以客家語拼音做為研究對象,對其關鍵字集做前置的比較分析,然後以植於中國餘數定理建構出最佳完美的赫序函數。
    將中國餘數定理應用到赫序法則內的好處,就是可以避免碰撞(collision)的問題,然而關鍵字集數量大的時候,也會產生常數C值太大的問題,本研究嘗試將關鍵字集做適當分組,控制關鍵字集內的C值大小,所多付出的記憶空間是額外的C值分組參數表,對於負載係數(Loading Factor)稍稍有影響,卻可降低C值之大小。
    最後,本文將國語、台語、客家語等台灣三大語系之羅馬拼音統合匯整,建立一個共同的赫序函數,如此就不需要個別建構某語系的赫序函數,但是,國台語三語係合併會讓關鍵字集增多,必須做更多的分組方能使C值成長受到控制,然而關鍵字集如果分組太多會造成記憶空間之利用效率降低。對此,本文對於負載係數、C值、最大C值所用到的質數數量做迴歸分析,可以知道負載係數與C值的關係圖,而不會僅於追求記憶空間效能而忽略C值的大小。

    目錄:

    第一章ˋ緒論...........................................1
    第一節、研究動機........................................1
    第二章、文獻探討........................................2
    第一節、赫序法則回顧.....................................2
    第二節、常見的赫序函數...................................3
    第三節、赫序函數的效能分析...............................6
    第四節、適用於文字處理的赫序函數..........................8
    第五節、植於中國餘數定理之最佳完美赫序函數.................14
    第三章、建構客家語拼音赫序函數............................26
    第一節、關於客家語......................................26
    第二節、建構客家語拼音之關鍵字分組的赫序函數...............27
    第三節、建構國台客三大語系的羅馬拼音之赫序函數..............33
    第四節、負載係數分析.....................................40
    第四章、結論............................................42
    參考文獻...............................................43
    附錄...................................................46
    附錄一 1428客家語拼音系統之赫序函數參數....................46
    附錄二 4135國台客三語合併之羅馬拼音之赫序函數參數...........56