您現(xiàn)在的位置: 中國科技創(chuàng)新網(wǎng) > 文章中心 > 論文在線 > 文章正文

      段文潤1 段之宓2  段琦麗3

      (1.四川大學(xué)外國語學(xué)院,610064;2.中國電子科技集團(tuán)公司第十研究所,成都,610036;

      3.中國電信成都分公司  610051)

      摘要: 本文提出了隱詞形這一計算語言學(xué)的新概念,并基于此概念建立了隱詞形語法。隱詞形理論要求應(yīng)將作為代數(shù)系生成元集的自然語言的詞的集合,按照其出現(xiàn)的言語語境,劃分為最小等價類子集。因而,作為構(gòu)句基礎(chǔ)元素的隱詞形在句法功能和語義上便是無歧義的,而隱詞形語法規(guī)則便是帶有語義和語境信息的語法。這種語法曾用在我們的機(jī)器翻譯試驗(yàn)系統(tǒng)JX—1上,并證明具有很強(qiáng)的排歧功能。

      關(guān)鍵詞:隱詞形,隱詞形語法,等價類子集,言語語境,排歧,機(jī)器翻譯,統(tǒng)計方法

      中圖分類號:H03,TP301.2   文獻(xiàn)標(biāo)識碼: A 

      Abctract: In this paper we provided a new formalized conception of computer linguistics—potential wordform, and  on the basis of this conception we built a potential wordform grammar. The theory of potential wordform requires that words of national language, as the set of generative elements of a algebraic system, should be divided into minimum equivalence class subsets according to the speech situation where the words appear. Therefore, the potential wordform, as the fundamental element of sentence building, is disambiguous in its syntactic function and semantics, and the potential wordform grammar is a grammar with sematics and situation informations. The grammar was applied in our experimental machine translation system JX—1 and was proved to be a grammar highly effective in disambiguation .

      Key words: potential wordform, potential wordform grammar, equivalence class set, speech situation, disambiguation, machine translation, statistical method 

      1. 機(jī)器翻譯歷史及現(xiàn)狀評論

      機(jī)器翻譯始自上世紀(jì)四十年代,已有60余年的歷史。目前正進(jìn)入初步實(shí)用階段(如國外的Eurotran系統(tǒng)及國內(nèi)的若干上市軟件)。所謂初步實(shí)用,離真正的實(shí)用還很遠(yuǎn)。目前,各系統(tǒng)對簡單句及受限文本(如可“對齊”語句)的翻譯尚可,而對復(fù)雜長句及非受限文本(如不能“對齊”的語句)的處理則僅僅處于起步階段。后者的質(zhì)量,若按外語專業(yè)的標(biāo)準(zhǔn)打分(目前尚無權(quán)威的國際測試標(biāo)準(zhǔn))只能達(dá)到30—40%的合格率。提高質(zhì)量的瓶頸在于語言知識的粒度不夠細(xì),從而不能有效排除歧義。對于“細(xì)度”問題,上世紀(jì)70年代末—80年代,即曾提出過“格語法”(Fillmore)[1]、“廣義短語結(jié)構(gòu)文法”(Gerald Gazdar)、“詞匯—功能語法”(Bresnan及Kaplan)、“功能合一語法”(M.Kay)、“多叉多標(biāo)記樹”(馮志偉)[2]以及《現(xiàn)代漢語語法信息辭典詳解》(俞士汶等人)[3]等理論和著作。這些理論重視詞匯及短語的“復(fù)雜特征”(即“細(xì)度”),為機(jī)器翻譯可預(yù)期的商業(yè)實(shí)用指明了正確的道路。然而,它們在具體的理論闡述與工程實(shí)施上,過多地把注意力放到了復(fù)雜特征知識的表達(dá)(如特征矩陣、多叉多標(biāo)記樹等)及相關(guān)的演算(如非循環(huán)有向圖、合一運(yùn)算等)上。對復(fù)雜特征應(yīng)是一些什么特征及它們的排歧機(jī)制本身反倒重視不夠。此后流行的語料庫語言學(xué)及統(tǒng)計方法(馬爾科夫隨機(jī)過程、信息熵等)為機(jī)器翻譯所需之詞匯及語法知識的獲取開辟了半自動化的道路,也為機(jī)器詞典的義素化打下了基礎(chǔ)(如普林斯頓的Wordnet[4]、董振東的Hownet)。然而,對復(fù)雜特征本身應(yīng)如何全面細(xì)化及各特征的排歧機(jī)制仍缺乏商用性的貢獻(xiàn)。統(tǒng)計排歧的詞類幾乎僅是傳統(tǒng)語法的詞類,而義素詞典也還不能完全適應(yīng)詞義排歧的需要,不能有效解決機(jī)譯中的排歧問題。因此,語言知識粒度的細(xì)化及其排歧機(jī)理的研究,至今仍是有待突破的瓶頸。我們在上世紀(jì)80年代末也曾獨(dú)立提出了基于復(fù)雜特征的“隱詞形論”框架[5],此后在一次受限詞典與受限句型的英—漢機(jī)譯試驗(yàn)(JX—1系統(tǒng))的實(shí)踐中又對此理論進(jìn)行了具體化和充實(shí)。實(shí)踐證明,“隱詞形論”在排除歧義、提高機(jī)譯質(zhì)量方面取得了明顯的效果,有必要進(jìn)一步研究充實(shí),形成詞典和語法,以便用於語言工程。

       

        2. 隱詞形論簡述  3. 隱詞形的知識表達(dá),獲取與運(yùn)用

       

      參考文獻(xiàn):

      1.  Charles。省。疲椋欤欤恚铮颍. 格辨[A].語言學(xué)譯叢(第2輯)[C].北京:社科院出版社.1980.

      2.馮志偉. 機(jī)器翻譯研究 [M]. 中國對外翻譯出版公司. 2004

      3.俞士汶等.現(xiàn)代漢語語法信息詞典 [M]. 北京:清華大學(xué)出版社.1998

      4.Cognitive。樱悖椋澹睿悖濉。蹋幔猓铮颍幔鬿ry。幔簟。校颍椋睿悖澹簦铮睢。眨睿椋觯澹颍螅椋簦祝铮颍洌危澹簦1.7.1[EB/OL].http://www.cogsci.princeton.edu/~wn/,2004-05-10

      5. 段文潤.俄語簡單句句型的“群”描寫——數(shù)理語言學(xué)的一種代數(shù)方法[A],科學(xué)的整體化趨勢[C]. 成都:四川大學(xué)出版社.1989

      6.  Richard Montague. Universal grammar[A], ”Formal Philosophy”, Selected Papers of Richard Montague[M].Yale University Press.1979

      7. 趙元任.漢語口語語法[M].商務(wù)印書館.1979

      8. 段綺麗.機(jī)器翻譯中詞義的常識排岐[A].重慶大學(xué)學(xué)報 [J ],2005,28(3):69-71

      9.  Русская Грамматика. Академия Наук СССР, Институт Русского Языка, Издательство Наука .1980

      10. F. de Saussure,Cours de linguistigue generale,[M] .Paris,1972 .Курс  Общей лингвистики ,Русское издание

      11.  Chomsky , N.  Aspects of the Theory of Syntax [M]. Cambridge,Mass,The MIT Press. 1965

      12.  段鷹,荷芒. 機(jī)器翻譯中的一種狀態(tài)空間搜索方法[J]. 重慶大學(xué)學(xué)報,2006,29(3):99-102

      13. 段鷹,段文澤. 一類相關(guān)對象組合的解耦遞階智能搜索. 中國科技創(chuàng)新網(wǎng),論文在線: /Article/ShowArticle.asp?ArticleID=2644

      14.黃昌寧,夏瑩主編. 語言信息處理專論 [M]. 北京:清華大學(xué)出版社,廣西科學(xué)技術(shù)出版社.1996

      15. 段綺麗,段之宓. 機(jī)器翻譯中自然語言的梯級表示模型[A].機(jī)器翻譯研究進(jìn)展[C].北京:電子工業(yè)出版社,2002

      文章錄入:zgkjcx    責(zé)任編輯:zgkjcx 
    1. 上一篇文章:

    2. 下一篇文章:
    3.  

      關(guān)于我們 | 加入收藏 | 聯(lián)系我們 | 設(shè)為首頁 | 廣告說明 | 合作項(xiàng)目

      名稱:科技創(chuàng)新網(wǎng) 工信部備案號:京ICP備13040577號-2 京公網(wǎng)安備11010802045251號
      版權(quán)所有:未經(jīng)授權(quán)禁止復(fù)制或建立鏡像 E-Mail:zgkjcx08@126.com
      中文字幕日本视频精品一区,99re66热这里精品7,99精品视频在线观看,亚洲无码潮吹精品视频 96热在这里只有免费精品