俄语学习网

  • 高级搜索
  • 收藏本站
  • 网站地图
  • RSS订阅
  • 设为首页
  • TAG标签
  • 俄语词典
  • 俄语翻译
当前位置:首页 »俄语语法 » 俄语初级语法 » 正文

俄语基本名词性构句块模式研究三

时间:2012-04-26来源:互联网  进入俄语论坛
核心提示:基本NP构句块模式的信息标注 信息标注重在为次范畴化后的基本NP构句块模式提供必要信息。在基于规则的处理系统中,信息标注具有重要意义。基本NP构句块模式的信息标注,在理论上
(单词翻译:双击或拖选)

 基本NP构句块模式的信息标注
 信息标注重在为次范畴化后的基本NP构句块模式提供必要信息。在基于规则的处理系统中,信息标注具有重要意义。基本NP构句块模式的信息标注,在理论上为NP的研究提供了新的内容,拓宽了研究者的视野;在操作中可为建造语言知识库和实现NP构句块的自动处理提供信息源。确定一个合理、统一、开放的信息标注集是实现信息标注的必要前提。从实现NP构句块自动处理的角度出发,我们确定一个包括构句块的形式化表达、语义关系、主导词、例词、汉化语序等5项内容组成的信息标注集,无法归入标注集,但对于NP构句块的自动处理具有重要价值的信息,可体现在备注中。
   构句块的形式化表达是用形式化语言表征基本NP构句块模式化的结果。在数学中,用公式a2+b2=c2表示直角三角形两个直角边与第三条边之间的长度关系。在自然语言处理中,借用元语言表达手段表示语言单位的内部结构,便于对其理解和计算。
   语义问题是目前机器翻译中的重点和难点。实现语言单位的“句法-语义一体化描写”是自然语言处理中不可避免的趋势,句法分析侧重对语言单位结构的理解,语义分析着重阐释语言单位的意义。在基本NP构句块模式化过程中,本文力求明确模式内部的语义关系。
   构句块的语法属性集中体现在主导词上。Adj N1,Adv N1,Pron N1等模式中只有一个N1,N1即为构句块的主导词。N1 P Nf和N1 Nf模式中的主导词一般为N1,ОДНОР СУЩ模式中存在两个(或两个以上)的主导词。确定模式的主导词,便于实现构句块的规约(即NP→N)并减少NP构句块中的“节”点。
   基于规则建模的主要依据是研究者的语言知识。基于规则建造的模式分析效率较高,但是主观性较大,往往需要经过真实文本的验证。本文为每个基本NP构句块模式配备相应例词,供读者检验。汉化语序是模式相应的汉语对等翻译形式。本文根据不同上下文为NP构句块提供不同汉化语序的方案,增强了译文的合理性和准确性。
   备注中的内容主要体现为:1)基本NP构句块模式对其组成要素的要求。构句块并不是主导词与修饰语的任意组合,对各组成要素的形态特征、语义类别进行规定是NP构句块自动处理的重要辅助模块;2)NP构句块模式的变体形式。在自然语言处理中,不同的变体形式往往包含在一个模式中,一方面可以节省模式占用的内存空间,另一方面有利于模式的查询,提高运算速度。实现对8类基本NP构句块模式的次范畴化和信息标注后,所有的模式按顺序排列。现在我们从中选出部分模式,来展示NP构句块模式化的过程。
 
 
N1 P Nf :以Nf的形态特征进行第一层级的次范畴化。
   N1 P N2:选取P的形态特征进行第二层级的次范畴化。
   N1 от N2:根据模式内部的语义关系可进行第三层级的次范畴化。
   至此,模式的次范畴化已经完成,可以对第三层级次范畴化后得到的基本NP构句块模式进行信息标注。
   模式表达式: N1 от N2;模式内部的语义关系:行为-客体意义;模式主导词:N1;例词:отличие от нас等;模式汉化语序:对N2的N1/ N1 N2;备注:该模式中的N1可以为:1)защита,охрана,освобождение,гарантия等表示摆脱威胁、困境等意义的动名词。例如,защита от непогод,освобождение от пустяков等;2)отказ,отличие,отречение,отвлечение,отнятие等部分带有前缀от-的动名词,如отречение от трона,отказ от просьбы等。
   模式表达式:N1 от N2;模式内部的语义关系:事物-空间意义;模式主导词:N1;例词:тропинка от леса等;模式汉化语序:N2旁的N1.
   模式表达式:N1 от N2;模式内部的语义关系:事物-时间意义;模式主导词:N1;例词:телеграмма от пятницы,письмо от двацатого мая等;模式汉化语序:N2的N1
  …
   N1против N2
   …
   N1 P N3
   …
   4 基本NP构句块模式的操作原理
   自然语言处理是一个包含词法分析、句法分析、语义分析等若干处理模块的复杂过程。各处理模块是相对独立的,即完成相应的操作任务,又紧密相连,集中体现为前一个处理模块的结果对后一个模块的分析产生直接影响。构句块的分析作为句法分析(或句法-语义分析)的预处理模块,该处理模块应建立在成熟的词法分析技术基础上,词法分析的出口即为构句块分析的入口。以Я читаю книгу为例,经过词法分析,对句中的词形进行形态还原并赋予相应的词法信息,结果如下:
   я(代词,单数,第一格,я)
   читаю(动词,单数,第一人称,主动态,未完成体,行为,читать)
   книгу(名词,单数,第四格,语言作品,книга)
   进入构句块分析阶段,首先考虑各种类别基本NP构句块的组配顺序,同时完成对构句块的规约(NP→N),直至实现整个NP构句块的分析。这里列举几条组配规则,以展示其分析步骤。
 
规则1:8类基本NP构句块模式的组配顺序为:A(Adv N1,Adj N1,Pron N1,Num Nf)→B(N1 P Nf,N1 Nf,N1 V)→C(ОДНОР СУЩ)。用此规则分析красная шапка сестры и джинсы братаNP构句块,规约结果可表示为{〔(красная шапка) сестры〕и (джинсы брата)}。
   规则2:当修饰语本身带有接格关系时,优先进行规约。对于NP构句块знакомый мне человек的规约顺序为〔(знакомый мне) человек〕。
   规则3:对于上面A组内的模式,经常出现一个主导词前存在多个修饰语的情况,这时优先规约距离主导词近的修饰语。例如NP构句块пять красных шапок的组配顺序为〔пять (красных шапок)〕。当修饰语前出现若干同质修饰语时,优先规约同质修饰语。对красивая францзуская машинаNP构句块进行规约,结果如下:〔(красивая францзуская)машина〕。
   规则4:当一个构句块中“嵌套”另一个构句块时,优先规约被嵌套的结构。构句块интерес к содержательной стороне языка的规约顺序如下:{интерес к 〔(содержательной стороне)языка〕}。
   对俄语句子中的NP构句块进行自动化处理时,除引入组配规则外,还需解决NP构句块边界测定、后置定语的分析和识别、歧义消除等一系列技术问题,限于篇幅,不再赘述。
   5 结束语
   句法-语义分析的一个热点是注重句子的局部分析,内容涉及基本名词短语(Base NP)的确定、短语边界的划定、语块(或组块)分析等(赵铁军等 2000:157-175)。虽然上述研究的出发点和方法各不相同,但宗旨大体一致,即为后来的句法-语义分析作准备,提高句法分析的质量。就某种意义而言,构句块分析也属于一种局部分析的方法。由此可见,构句块分析具有广阔的研究价值和应用前景。
   本文以NP构句块的内部结构为基础,以构句块的模式化和形式化为表达手段,力求对俄语基本NP构句块进行定性化描写,为实现NP构句块的自动分析和识别提供信息源,为短语分析以及其他构句块的分析积累经验。
 

 

 

 

顶一下
(0)
0%
踩一下
(0)
0%

热门TAG: 信息标注


------分隔线----------------------------
栏目列表