2017年10月27日
論理文法に見るファジィらしさ1
ここでは、HPSGが採用する記号のシステムと Montague文法を中心とした論理文法の小史が議論の対象となる。特に、テキストのダイナミズムの扱い方を問題にする際、状況意味論、パージング・シュガーリングそして直感主義論理などをベースにして、単語や句または文章を扱いながら、論理文法を実際のテキストとマージしていく。まず、Pollard and Sag (1994) の第1章よりHPSGの記号シス テムを説明する。統語論、意味論および音韻論のマージを目指したCarl PollardとIvan A. Sagの心意気が読み取れることであろう。
HPSGの記号のシステムについて説明する。例えば、ドイツ語の人称代名詞 er を HPSG の素性構造によって表記してみよう。
HPSGが採用する素性構造は、分類型である。各接点は、分類記号(synsemやlocalなど)によるラベルを持っており、枝分かれの方向を示す属性ラベル(PHONやSYNSEM)も存在する。さらに、 AVM (attribute-value matrix) が採用されているため、全体的にも部分的にも分類が把握しやすくなっている。例えば、LOCALだけを抽出して言語表現を考察することもできる。
SYNSEMは、SYNTAXとSEMANTICSとういう2つの属性からなる複合情報である。SYNSEMは、例えば、補文の主語やto不定詞句の支配語が共有する情報を含むることから、特定の複合表現を単一表現に局所化する必要ができる。それが、LOCAL(LOC)である。この情報には、 CATEGORY (CAT)、CONTENT (CONT)、CONTEXT (CONX)という 3つ の属性が存在する。CATは、HEADとSUBCATという属性を含んでいる。
HEADの値には、substantive (subst)と functional (fimct)が存在する。前者 には、名詞(noun)、動詞(verb)、形容詞(adjective)、前置詞(preposition)が、 後者には、限定子(determiner) やマーカー(complimentizer) が含まれる。名詞は、格(CASE)の素性を、前置詞は、前置詞の書式 (PFORM) を、動詞は、ブール素性(AUXILIARY (AUX)、PREDICATIVE (PRD))、置換 (INVERTED (INV)) といった属性 VFORM を持つ。SUBCATの値は、記号のバランスを示唆するもので、問題の記号が飽和状態を作る上で他にどのような記号と結合すればよいのかという指定になる。例えば、格の割り当てである。
CONTは、INDEXと呼ばれる属性を担う nominal object (nom-obj) とい う素性構造である。“er rasiert sich”「彼は髭を剃る」という文の場合、er と sich は構造上のインデックスを共有する。“er” の CONTENT 値は personal pronoun (ppro)、“sich” の CONTENT 値は reflexive (refl) になる。この属性は、特に呼応(agreement) の問題で重要になる。さらに、意味上の制約を表すために、RESTICTION 属性を設けている。これは、バラメ 一夕寒象(parametrized state of affairs (psoa)) を考慮するためのものである。
CONXは、BACKGROUND (BACKR)と呼ばれる context 属性を持っている。これも psoa に対応する。しかし、CONTENT値が文字通りの意味と関連するのに対して、BACKGROUND 値の方は、前提条件に対応するア ンカー条件を表している。例えば、上図の “er” は、男性を受けることが前提となっている。
nelist (nonempty list) と elist (empty list) は、一種の素性構造である。前者には、FIRSTとRESTという二つの属性が指定される一方、後者にはいかなる属性ラベルも適応されない。また、e は、モデル化するための接点を導くものであり、便宜上、ε が存在する場合、neset ラベルを、存在しない場合、eset ラベルを担うことになる。
HPSG の音韻論について簡単に説明する。HPSG の PHON の値は、音素の連鎖と見なされている。一般的に HPSG のような記号ベースの理論は、制限の強い音韻論を採用する。例えば、記号には音韻論と意味属性が内在しており、それらを分散するために統語属性が制限を課していくと考えている。
各接点の属性値は、娘の属性値にとって関数となっている。これは、 範疇文法に基づいた音韻論と同様に、一 種の構成性原理を採用している。
記号は、音韻の内容、分散するための統語的な特徴そして意味への貢献といった少なくとも3つの次元で変化している。そして、より大きな記号を形成するために別の記号と結合していく。 また、文法組織は、形態素の貯蔵庫といえるレキシコンのために存在し、 形態素の構造に対する制限は、レキシコンに関する一般化と見なすことができる。つまり、レキシコンに関する一般化が、形態素として生じる記号に応用される。
論理文法には、自然言語と論理言語をつなぐための役割がある。また、 小説には必ず、様相、時間、存在といった推論と共有可能な情報が存在する。本書の目的は、とある作家(ここではThomas Mann) の文体がどのような推論なのかを考えていくことである。こうした言語の裏側に存在する推論を捉えるこができれば、緩衝材(ここでは PTQ など)を介して、人間とコンピュータの間に立てるロジックの方向性を決めることができる(ここではFuzzy Logic)。
まずポイントになるのが、Richard Montague の PTQ (The Proper Treatment of Quantification in Ordinaiy English)。夕イトルにもあるように、 PTQ は、量化の問題を取り上げ、自然言語と論理言語の翻訳技法について扱っ ている。PTQは、生成文法との整合性も良く(詳細にっいては、GPSG を参照すること)、この手法を概ね理解することができれば、英語の基本表現を基にした分析樹から内包論理への変換方法と、分析樹から簡単な英語の文へのシュガーリングという二重構造も理解できる。なお、シュガーリングは、パージングと逆のプロセスになる。
次に、直感主義論理を取り上げる。直感主義論理は、PTQ のような二重構造ではなく、シュガーリング と意味解釈に対する表現の形式化が存在するだけである。直感主義もやはり量化の問題について古典的な二値論理では対応できないという立場を取る。確かにタイプ理論が重要な役割を果たす。しかし、PTQ が考察した量化と照応だけではなく、条件文から文脈に依存するテキストのダイナミズムも視野に入れるため、本論では、PTQと類似した構造を持っMartin-Löf のタイプ理論を採用する。
直感主義論理と同様に、ファジィ論理は多値論理の系列に属している。 1960年代前半、Zadehは、厳密な数学と曖昧な現実との矛盾に橋渡しをすべく、真理値だけではなく概念に対しても曖昧な値を導入することに成功した。こうして産声を上げたファジィ理論は、システム系の理論として成長しつつ、言語系の研究者にも注目されるようになっていく。本書では、テキストの情報を処理するために最低限必要と思われる概念、 例えば、ファジイ集合、ファジイ論理、曖昧な数字そしてファジイコン トロールなどを「魔の山」に重ねて説明していく。そして、推論の土台となる記憶や知識の問題と話を照合しつつ、「魔の山」におけるイロニ 一的な距離の問題を音の情報も含めて考察する。つまり、本書における結論は、Thomas Mannのイロニーを形式論で記述する場合、ファジ イ推論を選択することが現状ではベストであるということになる。
花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より
HPSGの記号のシステムについて説明する。例えば、ドイツ語の人称代名詞 er を HPSG の素性構造によって表記してみよう。
HPSGが採用する素性構造は、分類型である。各接点は、分類記号(synsemやlocalなど)によるラベルを持っており、枝分かれの方向を示す属性ラベル(PHONやSYNSEM)も存在する。さらに、 AVM (attribute-value matrix) が採用されているため、全体的にも部分的にも分類が把握しやすくなっている。例えば、LOCALだけを抽出して言語表現を考察することもできる。
SYNSEMは、SYNTAXとSEMANTICSとういう2つの属性からなる複合情報である。SYNSEMは、例えば、補文の主語やto不定詞句の支配語が共有する情報を含むることから、特定の複合表現を単一表現に局所化する必要ができる。それが、LOCAL(LOC)である。この情報には、 CATEGORY (CAT)、CONTENT (CONT)、CONTEXT (CONX)という 3つ の属性が存在する。CATは、HEADとSUBCATという属性を含んでいる。
HEADの値には、substantive (subst)と functional (fimct)が存在する。前者 には、名詞(noun)、動詞(verb)、形容詞(adjective)、前置詞(preposition)が、 後者には、限定子(determiner) やマーカー(complimentizer) が含まれる。名詞は、格(CASE)の素性を、前置詞は、前置詞の書式 (PFORM) を、動詞は、ブール素性(AUXILIARY (AUX)、PREDICATIVE (PRD))、置換 (INVERTED (INV)) といった属性 VFORM を持つ。SUBCATの値は、記号のバランスを示唆するもので、問題の記号が飽和状態を作る上で他にどのような記号と結合すればよいのかという指定になる。例えば、格の割り当てである。
CONTは、INDEXと呼ばれる属性を担う nominal object (nom-obj) とい う素性構造である。“er rasiert sich”「彼は髭を剃る」という文の場合、er と sich は構造上のインデックスを共有する。“er” の CONTENT 値は personal pronoun (ppro)、“sich” の CONTENT 値は reflexive (refl) になる。この属性は、特に呼応(agreement) の問題で重要になる。さらに、意味上の制約を表すために、RESTICTION 属性を設けている。これは、バラメ 一夕寒象(parametrized state of affairs (psoa)) を考慮するためのものである。
CONXは、BACKGROUND (BACKR)と呼ばれる context 属性を持っている。これも psoa に対応する。しかし、CONTENT値が文字通りの意味と関連するのに対して、BACKGROUND 値の方は、前提条件に対応するア ンカー条件を表している。例えば、上図の “er” は、男性を受けることが前提となっている。
nelist (nonempty list) と elist (empty list) は、一種の素性構造である。前者には、FIRSTとRESTという二つの属性が指定される一方、後者にはいかなる属性ラベルも適応されない。また、e は、モデル化するための接点を導くものであり、便宜上、ε が存在する場合、neset ラベルを、存在しない場合、eset ラベルを担うことになる。
HPSG の音韻論について簡単に説明する。HPSG の PHON の値は、音素の連鎖と見なされている。一般的に HPSG のような記号ベースの理論は、制限の強い音韻論を採用する。例えば、記号には音韻論と意味属性が内在しており、それらを分散するために統語属性が制限を課していくと考えている。
各接点の属性値は、娘の属性値にとって関数となっている。これは、 範疇文法に基づいた音韻論と同様に、一 種の構成性原理を採用している。
記号は、音韻の内容、分散するための統語的な特徴そして意味への貢献といった少なくとも3つの次元で変化している。そして、より大きな記号を形成するために別の記号と結合していく。 また、文法組織は、形態素の貯蔵庫といえるレキシコンのために存在し、 形態素の構造に対する制限は、レキシコンに関する一般化と見なすことができる。つまり、レキシコンに関する一般化が、形態素として生じる記号に応用される。
論理文法には、自然言語と論理言語をつなぐための役割がある。また、 小説には必ず、様相、時間、存在といった推論と共有可能な情報が存在する。本書の目的は、とある作家(ここではThomas Mann) の文体がどのような推論なのかを考えていくことである。こうした言語の裏側に存在する推論を捉えるこができれば、緩衝材(ここでは PTQ など)を介して、人間とコンピュータの間に立てるロジックの方向性を決めることができる(ここではFuzzy Logic)。
まずポイントになるのが、Richard Montague の PTQ (The Proper Treatment of Quantification in Ordinaiy English)。夕イトルにもあるように、 PTQ は、量化の問題を取り上げ、自然言語と論理言語の翻訳技法について扱っ ている。PTQは、生成文法との整合性も良く(詳細にっいては、GPSG を参照すること)、この手法を概ね理解することができれば、英語の基本表現を基にした分析樹から内包論理への変換方法と、分析樹から簡単な英語の文へのシュガーリングという二重構造も理解できる。なお、シュガーリングは、パージングと逆のプロセスになる。
次に、直感主義論理を取り上げる。直感主義論理は、PTQ のような二重構造ではなく、シュガーリング と意味解釈に対する表現の形式化が存在するだけである。直感主義もやはり量化の問題について古典的な二値論理では対応できないという立場を取る。確かにタイプ理論が重要な役割を果たす。しかし、PTQ が考察した量化と照応だけではなく、条件文から文脈に依存するテキストのダイナミズムも視野に入れるため、本論では、PTQと類似した構造を持っMartin-Löf のタイプ理論を採用する。
直感主義論理と同様に、ファジィ論理は多値論理の系列に属している。 1960年代前半、Zadehは、厳密な数学と曖昧な現実との矛盾に橋渡しをすべく、真理値だけではなく概念に対しても曖昧な値を導入することに成功した。こうして産声を上げたファジィ理論は、システム系の理論として成長しつつ、言語系の研究者にも注目されるようになっていく。本書では、テキストの情報を処理するために最低限必要と思われる概念、 例えば、ファジイ集合、ファジイ論理、曖昧な数字そしてファジイコン トロールなどを「魔の山」に重ねて説明していく。そして、推論の土台となる記憶や知識の問題と話を照合しつつ、「魔の山」におけるイロニ 一的な距離の問題を音の情報も含めて考察する。つまり、本書における結論は、Thomas Mannのイロニーを形式論で記述する場合、ファジ イ推論を選択することが現状ではベストであるということになる。
花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より
【このカテゴリーの最新記事】
-
no image
-
no image
-
no image
-
no image
-
no image
この記事へのコメント
コメントを書く
この記事へのトラックバックURL
https://fanblogs.jp/tb/6903080
※ブログオーナーが承認したトラックバックのみ表示されます。
この記事へのトラックバック