博碩士論文 etd-0906107-025114 詳細資訊


[回到前頁查詢結果 | 重新搜尋]

姓名 王勝明(San-ming Wang) 電子郵件信箱 E-mail 資料不公開
畢業系所 電機工程學系研究所(Electrical Engineering)
畢業學位 碩士(Master) 畢業時期 95學年第2學期
論文名稱(中) 台灣、香港與大陸地區中文地址語音辨識系統之設計研究
論文名稱(英) A Design of Mandarin Speech Recognition System for Addresses in Taiwan,Hong Kong and China
檔案
  • etd-0906107-025114.pdf
  • 本電子全文僅授權使用者為學術研究之目的,進行個人非營利性質之檢索、閱讀、列印。
    請遵守中華民國著作權法之相關規定,切勿任意重製、散佈、改作、轉貼、播送,以免觸法。
    論文使用權限

    電子論文:校內校外均不公開

    論文語文/頁數 中文/51
    統計 本論文已被瀏覽 5566 次,被下載 0 次
    摘要(中) 本論文的主要目的在針對中文地名語音辨識系統進行設計與實作。完成之系統能正確辨識出台灣地區之戶籍及通訊地址,大陸地區北京、上海、天津、重慶四個直轄市之通訊地址,與香港地區之路名及學校飯店等公眾場所之名稱。論文中運用梅爾倒頻譜係數、隱藏式馬可夫模型與語音文字比對策略,來作初步之評量候選機制;並配合中文之聲調辨識,以提昇最終之系統正確率。在語者特定的環境下,使用Celeron 2.4 GHz之CUP與Red Hat 9.0 之作業系統,正確率可逹到90%,而辨識約可在3秒內完成。
    摘要(英) The objective of this thesis is to design and implement a speech inputting system for addresses in Taiwan,Mainland china and HongKong,The completed system has the capability to identify full census and posting addresses in Taiwan and full posting addresses in Peking、Shanghai、Tien-Jin and Chungchin of China。For HongKong,a partial address system,including region/street name or school,hotal and other public location names,is implemented。
    In this thesis,Mel frequency cepstrum coefficient,Hidden Mavkov model and lexicon search strategy are applied to choose the initial address candidates;Mandarin intonation classification technique is then used to increase the final correct rate,under speaker dependent case,a 90%correct rate can be reached by using a Intel Celeron 2.4GHz CPU and RedHat Linux 9.0 operating system。The total address-inputting task can be completed within 3 seconds。
    關鍵字(中)
  • 隱藏式馬可夫模型
  • 梅爾倒頻譜係數
  • 關鍵字(英)
  • MFCC
  • Hidden Markov Model
  • 論文目次 目  錄
    致謝Ⅰ
    摘要Ⅲ
    目錄Ⅳ
    圖表目錄Ⅵ
    第一章 緒論1
    1-1 研究動機與目的1
    1-2 研究方法簡介2
    1-3 論文架構2
    第二章 語音處理的基本技術3
    2-1 語音辨識系統的基本構3
    2-1-1 語音辨識之技術分類3
    2-1-2 語音辨識流程4
    2-2 語音訊號的前處理介紹5
    2-2-1 端點偵測(Endpoint Detection)5
    2-2-2 能量(Energy)6
    2-2-3 越零率(Zero Crossing Rate)7
    2-2-4 線性預估誤差能量(LPCEE)9
    2-3 特徵萃取(Feature Extraction)13
    2-3-1 音框化13
    2-3-2 標準化(Normalize)14
    2-3-3 漢明窗(Hamming window)15
    2-3-4 傅立葉轉換16
    2-3-5 倒頻譜係數(Cepstrum Coefficient)17
    2-4 隱藏式馬可夫模型(Hidden Markov Model, HMM)20
       
    第三章 辨識系統設計25
    3-1 資料庫建立25
    3-1-1 中國省地縣鄉建立25
    3-1-2 大陸四個直轄市路名建立28
    3-1-3 香港資料庫的建立29
    3-1-4 台灣地址資料庫的建立30 
    3-2  系統輸入介紹32
    3-3  系統架構37
    3-4 系統相關設定41
    3-5 實驗結果42
    第四章 結論與未來展望43
    參考文獻44
    參考文獻 [1] 北京郵政在線 http://www.bjpost.gov.cn/
    [2] 重慶郵政 http://www.cqpost.com.cn:8080/postcode/index.jsp
    [3] 中國行政區劃網 http://www.xzqh.org/quhua/
    [4] 王小川, “語音訊號處理”, 全華, 民國93年.
    [5] 魏宏章, “中文語音辨識系統之設計研究”國立中山大學電機工程研究所碩士論文,民國95年7月.
    [6] 陳躍升, “中文履歷表之語音建構之系統設計”國立中山大學電機工程研究所碩士論文,民國95年7月.
    [7] 林維琦, “古今中外人名語音辨識系統之設計研究”國立中山大學電機工程研究所碩士論文,民國95年7月.
    [8] 張文杰, “模型調式之語者辨識系統”國立中央大學電機工程研究所碩士論文.
    [9] 2006香港街道圖 萬里機構出版.
    [10] Lawrence Rabiner and Biing-Hwang Juang, “Fundamentals of Speech Recognition”, N.J.: Prentice Hail, 1993.
    [11] Tze Fen Li, “Speech recognition of mandarin monosyllables,” Patter Recognition, vol.36 pp2713-2721, April 2003.
    [12] L. R.Rabiner, “A tutorial on hidden Markov models and selected applications in speech recognition”, Proc, IEEE, vol.77, pp.257-286, Feb, 1989.
    [13] Kazunaga Yoshida, Takao Watanabe and Shinji Koga,“Large vocabulary word recognition based on demi-syllable hidden markov model using samll amount of training data”, C&C Information Technology Research Laboratories, NEC Corporation, 4-1-1 Miyazaki, Miyamac-ku, Kawasaki213, JAPAN.
    [14] Wai C. Chu, “Speech Coding Algorithms: Foundation and Evolution of Standardized Coders”, John Wiley & Sons, Inc. 2003
    [15] Jeff A. Bilmes, “A Gentle Tutorial of the EM Algorithm and its Application to Parameter Estimation for Gaussian Mixture and Hidden Markov Models” , Proc. ICSI, April 1998
    口試委員
  • 汪啟茂 - 召集委員
  • 李聰 - 委員
  • 陳志堅 - 指導教授
  • 口試日期 2007-07-26 繳交日期 2007-09-06

    [回到前頁查詢結果 | 重新搜尋]


    如有任何問題請與論文審查小組聯繫