久久99国产亚洲高清-久久99国产亚洲高清观看首页-久久99国产亚洲精品观看-久久99国产一区二区-久久99国产一区二区三区-久久99国产综合精品

樹人論文網(wǎng)一個專業(yè)的學(xué)術(shù)咨詢網(wǎng)站!!!
樹人論文網(wǎng)

基于 B/S框架的交互式英漢機器翻譯系統(tǒng)設(shè)計

來源: 樹人論文網(wǎng)發(fā)表時間:2021-12-20
簡要:摘 要:英語和漢語在很多方面都存在不同,因此在交流中經(jīng)常出現(xiàn)理解錯誤的現(xiàn)象。各種英漢翻譯系統(tǒng)的交互體驗感都較差,主要表現(xiàn)在用詞不準確、語法錯誤、系統(tǒng)發(fā)音不清楚、翻譯反饋速

  摘 要:英語和漢語在很多方面都存在不同,因此在交流中經(jīng)常出現(xiàn)理解錯誤的現(xiàn)象。各種英漢翻譯系統(tǒng)的交互體驗感都較差,主要表現(xiàn)在用詞不準確、語法錯誤、系統(tǒng)發(fā)音不清楚、翻譯反饋速度遲緩等方面。為此,文中設(shè)計一種基于 B/S 框架的交互式英漢機器翻譯系統(tǒng),以期輔助英漢語之間的交流。該系統(tǒng)以 B/S 三層架構(gòu)為基礎(chǔ)設(shè)計系統(tǒng)框架,在系統(tǒng)硬件部分,主要對關(guān)鍵的語音識別硬件、英漢翻譯硬件和翻譯結(jié)果輸出硬件進行具體分析;軟件部分主要對三個關(guān)鍵程序,即用戶登錄程序、語音識別程序、英漢翻譯程序進行設(shè)計。系統(tǒng)測試結(jié)果表明,利用所設(shè)計系統(tǒng)進行翻譯,譯文經(jīng)過專家評測后,人工評測綜合得分為 3.769分,大于 3.5分限定值,證明系統(tǒng)的翻譯質(zhì)量較高,可滿足用戶需求。

  關(guān)鍵詞:交互式翻譯;英漢翻譯;B/S框架;語音識別;系統(tǒng)設(shè)計;翻譯性能測試;系統(tǒng)測試

基于 B/S框架的交互式英漢機器翻譯系統(tǒng)設(shè)計

  張啟振; 孫先洪 現(xiàn)代電子技術(shù) 2021-12-15

  0 引 言

  種族之間最大的不同在于語言體系的不同,這就導(dǎo)致跨種族交流十分困難。英語作為全球通用語言,是外交中最常用的語言,而我國的母語為漢語,英漢語在詞匯、語法、語序、背景文化之間都存在極大的差異,這種差異使得彼此交流變得十分困難[1] 。因此,如何降低英漢語言之間的差異性,實現(xiàn)順暢交流成為研究的重點。基于上述背景,各種英漢機器翻譯系統(tǒng)被設(shè)計并廣泛應(yīng)用。例如,胡永久在規(guī)則策略的基礎(chǔ)上設(shè)計了一種英漢機器翻譯系統(tǒng),該系統(tǒng)的關(guān)鍵在于翻譯引擎和機器字典兩部分。該系統(tǒng)經(jīng)測試,可提高譯文質(zhì)量和分析效率。邢蕾基于雙層分析的思路提出并設(shè)計一種英漢機器翻譯譯文自動生成系統(tǒng),實現(xiàn)了英漢文本之間的自動轉(zhuǎn)換。郭永輝等人通過計算與實例庫之間的相似程度來進行機器翻譯,然后結(jié)合規(guī)則方法,提出基于混合策略的英漢機器翻譯系統(tǒng)。該系統(tǒng)經(jīng)測試,具有譯文正確率高和翻譯速度快的特點。

  盡管已設(shè)計出各種英漢翻譯系統(tǒng),但是這些系統(tǒng)的交互體驗感都較差,主要表現(xiàn)在用詞不準確、語法錯誤、系統(tǒng)發(fā)音不清楚、翻譯反饋速度遲緩等方面。針對上述問題,本文設(shè)計一種有效的交互式英漢機器翻譯系統(tǒng)具有重要的現(xiàn)實意義。B/S框架是現(xiàn)代系統(tǒng)設(shè)計和開發(fā)中常用的框架架構(gòu),具有分布性好、業(yè)務(wù)擴展方便、維護和開發(fā)簡單、共享性強、成本低等優(yōu)點。文中以 B/S 框架為基礎(chǔ)進行交互式英漢機器翻譯系統(tǒng)設(shè)計。最后通過功能測試,證明系統(tǒng)翻譯功能滿足用戶要求,驗證了系統(tǒng)的有效性。

  1 基于 B/S 框架的交互式英漢機器翻譯系統(tǒng)設(shè)計

  語言是人與人之間最直接的交流方式,一旦聽不懂對方的語言,就無法明白對方要表達的意思,也就無法進行交流。以往在很多外交場合,都需要一名翻譯作為雙方溝通的橋梁[2] 。而這種方式受到翻譯自身業(yè)務(wù)水平和職業(yè)素養(yǎng)的直接影響,存在很高的風險性。為此,機器翻譯系統(tǒng)被設(shè)計出來并廣泛應(yīng)用[3] 。針對上述機器翻譯系統(tǒng)存在的問題,本文設(shè)計一種基于 B/S 框架的交互式英漢機器翻譯系統(tǒng)。

  1.1 系統(tǒng)框架設(shè)計

  交互式英漢機器翻譯系統(tǒng)框架是在 B/S 三層架構(gòu)的基礎(chǔ)上設(shè)計出來的。B/S 三層架構(gòu)全稱為瀏覽器/服務(wù)器體系結(jié)構(gòu),是在 C/S 雙層架構(gòu)基礎(chǔ)上發(fā)展而來的,在很多方面都得到了優(yōu)化[4] 。表 1為 B/S架構(gòu)和 C/S 架構(gòu)具體優(yōu)缺點對比。

  基于 B/S 的交互式英漢機器翻譯系統(tǒng)框架主要由界面層、業(yè)務(wù)邏輯層、數(shù)據(jù)訪問層 3層組成,如圖 1所示。各層的具體功能如下:界面層:主要負責用戶與系統(tǒng)之間的交互[5] 。業(yè)務(wù)邏輯層:負責響應(yīng)用戶請求,實現(xiàn)各種業(yè)務(wù)處理,然后將結(jié)果反饋給用戶,是系統(tǒng)的核心層次。數(shù)據(jù)訪問層:負責對數(shù)據(jù)庫進行讀寫及管理。

  1.2 系統(tǒng)硬件設(shè)計本系統(tǒng)硬件主要分為三部分,包括語音識別硬件、英漢翻譯硬件和翻譯結(jié)果輸出硬件。下面對這三部分硬件中的關(guān)鍵元件進行分析[6] 。

  1.2.1 語音識別硬件語音識別硬件是一個以 STM32F103VET6大容量芯片為載體,搭載若干電路與接口的微處理器,其硬件組成結(jié)構(gòu)如圖 2所示。

  STM32F103VET6芯片是一款基于 CM3內(nèi)核的高性能 32位處理器,具有低功率、低電壓,并結(jié)合實時功能的極佳性能[7] 。該芯片技術(shù)參數(shù)如表 2所示。此外,該處理器主要硬件還包括話筒、放大濾波電路、液晶顯示器、音頻轉(zhuǎn)換芯片、揚聲器等部分[8] ,各部分的作用如下:

  1)話筒的作用是收集發(fā)聲者的話語; 2)放大濾波電路的作用是對語音進行增大和去噪處理,提高語音信號質(zhì)量; 3) 液 晶 顯 示 器 的 作 用 是 顯 示 語 音 處 理 過 程 和結(jié)果; 4)音頻轉(zhuǎn)換芯片的作用是將語音轉(zhuǎn)換文本形式或是將翻譯過來的文本語言轉(zhuǎn)換為目標語音; 5)揚聲器的作用是將翻譯的目標語言播放出來[9] 。

  1.2.2 英漢翻譯硬件

  英漢翻譯硬件是本系統(tǒng)的核心和關(guān)鍵硬件,該硬件是一塊用來進行嵌入式系統(tǒng)開發(fā)的電路板。該開發(fā)板上裝載了各種相關(guān)英漢翻譯程序,以便進行業(yè)務(wù)處理[10] 。本系統(tǒng)中的開發(fā)板為 DE2?70 開發(fā)板,其結(jié)構(gòu)如圖 3 所示。該方框圖中包括 Cyclone Ⅱ 2C70 FPGA、串行配置設(shè)備、USB Blaster電路、同步動靜態(tài)隨機存儲器、閃速存儲器、SD 卡槽、按鈕開關(guān)、編碼解碼器、主從控制器、收發(fā)器等。

  1.2.3 翻譯結(jié)果輸出硬件

  翻譯結(jié)果輸出硬件是系統(tǒng)末端部分,主要是將翻譯出來的目標語言進行語音輸出和翻譯結(jié)果顯示。在本系統(tǒng)中,翻譯結(jié)果輸出硬件為一個翻譯輸出機[11] 。該翻譯輸出機技術(shù)參數(shù)如表 3所示。

  1.3 系統(tǒng)軟件翻譯程序設(shè)計

  基于 B/S 框架的交互式英漢機器翻譯系統(tǒng)主要包括 3 個關(guān)鍵程序,即用戶登錄程序、語音識別程序、英漢翻譯程序[12] ,下面進行具體分析。

  1.3.1 用戶登錄程序

  用戶登錄程序是整個系統(tǒng)的初始程序,所有用戶都是通過這個程序進入系統(tǒng),進行相關(guān)業(yè)務(wù)操作。該程序包括三個頁面,即登錄頁面、新用戶注冊頁面及身份密碼驗證頁面。具體過程為:首先用戶根據(jù)登錄窗口進入頁面;如果是未經(jīng)注冊的新用戶,則需要通過登錄頁面轉(zhuǎn)入到新用戶注冊頁面,輸入相關(guān)信息,進行新用戶注冊;注冊成功后,轉(zhuǎn)回登錄頁面,輸入驗證信息,進入到系統(tǒng)中[13] 。系統(tǒng)根據(jù)用戶等級分配權(quán)限,包括考務(wù)管理員和用戶兩個權(quán)限等級。所有用戶只有在確定分配權(quán)限后才能進入開發(fā)系統(tǒng),然后進行相關(guān)業(yè)務(wù)操作。

  1.3.2 語音識別程序

  語音識別程序是指對一方用戶發(fā)出的源語言進行識別。具體過程分為四部分,即預(yù)處理、特征提取、模板庫建立和語音識別[14] 。

  1)預(yù)處理。采集到的一方用戶發(fā)出的源語音受到周圍環(huán)境的影響,質(zhì)量較差,因此需要進行預(yù)處理,具體包括去噪、放大、分幀和加窗等操作。

  2)特征提取。利用數(shù)字處理技術(shù)對語音進行特征提取,降低后續(xù)識別難度。提取出來的特征可以是波形、幅度、能量、頻譜等。

  3)模板庫建立。需要輸入大量語音資料,建立模板庫,以便為識別提供對比資料。

  4)語音識別。將提取出來的特征與模板庫進行測度匹配,計算相似度,得出識別結(jié)果。

  1.3.3 英漢翻譯程序

  英漢翻譯程序是系統(tǒng)的核心程序,主要任務(wù)是將一方用戶的源語言翻譯成另一方用戶可以理解的目標語言,具體過程如圖 4所示[15] 。

  2 系統(tǒng)測試與分析

  為測試所設(shè)計系統(tǒng)翻譯功能,在 Matlab 平臺上進行系統(tǒng)翻譯仿真測試。

  2.1 系統(tǒng)運行環(huán)境

  系統(tǒng)測試與分析在如表 4所示的環(huán)境中進行。

  2.2 語料庫

  本 翻 譯 系 統(tǒng) 語 料 中 的 資 料 主 要 來 自 Corpus of Contemporary American English(COCA)和現(xiàn)代漢語平衡語料庫,具體情況如表 5 所示。在該語料庫中包括由口語轉(zhuǎn)寫而來的文本,也包括語音文件。

  2.3 待翻譯材料

  本實驗選取的待翻譯材料來自一篇演講稿,具體內(nèi)容如圖 5所示。

  2.4 評估方法

  本系統(tǒng)的評估采用人工評測的方法,該方法流程如圖 6所示。

  該方法是由翻譯專家(在這里選擇 10 名專家)對本系統(tǒng)翻譯出來的譯文進行兩個方面的評測,具體包括可懂度(英文翻譯可以被人理解的程度)和忠實度(譯文對原有英文語義的忠實程度)。這兩個指標共分為 4 個等級,具體如表 6所示。

  對可懂度和忠實度各個等級進行量化,計算公式為: F = 0.3A + 0.7B 式中:A為可懂度;B為忠實度;F為得分,分數(shù)值大于 3.5 時,認為翻譯較為準確,達到用戶的翻譯要求。

  2.5 系統(tǒng)翻譯結(jié)果

  利用本系統(tǒng)對 2.3 節(jié)待翻譯材料進行翻譯,翻譯結(jié)果如圖 7所示。

  2.6 系統(tǒng)翻譯性能評價結(jié)果

  系統(tǒng)翻譯性能評價結(jié)果如表 7所示。從表 7可以看出,利用所設(shè)計系統(tǒng)進行翻譯,譯文經(jīng)過專家評測后,得到3.769的分數(shù),大于3.5限定值,認為譯文能準確地表達出原文的含義,沒有出現(xiàn)較多的錯誤,滿足用戶的需求。

  3 結(jié) 語

  隨著世界各國聯(lián)系的加強,英語作為國際通用語言,在很多社交場合的交流中都起到了關(guān)鍵作用。然而,由于我國漢語與英語語言體系的不同,理解上經(jīng)常出現(xiàn)偏差。為此,本文設(shè)計一種基于 B/S 框架的交互式 英漢機器翻譯系統(tǒng)。構(gòu)建由界面層、業(yè)務(wù)邏輯層、數(shù)據(jù)訪問層組成的基于 B/S 的交互式英漢機器翻譯系統(tǒng)框架,對語音識別硬件、英漢翻譯硬件和翻譯結(jié)果輸出硬件等系統(tǒng)硬件進行分析,對用戶登錄程序、語音識別程序、英漢翻譯程序等系統(tǒng)軟件進行分析。經(jīng)測試與分析,證明該系統(tǒng)的翻譯性能良好,能夠滿足用戶需求。然而,受到時間和經(jīng)驗的限制,系統(tǒng)測試上還存在不足,僅對一個國家語言的英語翻譯進行了測試,而不同的國家語言也存在一定的差別,因此有待進一步擴展測試,增加系統(tǒng)的適用性。