アフィリエイト広告を利用しています

広告

この広告は30日以上更新がないブログに表示されております。
新規記事の投稿を行うことで、非表示にすることが可能です。
posted by fanblog

2024年09月12日

論理文法に見るファジィらしさ8

 Hier handelt es sich um den lokalisierten Wert des lexikalischen Eintrags für ein attributives Adjektiv (z.B. blau), um die neue OUANTS/NUCLEUS Kodierung von psoas zu reflektieren.
 Die Interpretation des Adjektivs wie "blau" wird gezeigt.

a. x1|{Auge (x1), blau (x1)}

 Es erlegt dem Anker eines Parameters mehrere Beschränkungen auf. Wie es manchmal gesagt wird, zeigen die farbigen Beziehungen einen verdeckten Parameter, dessen Wert eine Skale der Farbe fixiert, sowie die Extensionen von “measure adjectives” abhängig von der Bestimmungen eines Maßstabs, eines Vergleichs und einer Norm für die Klasse der gemessenen Eigenschaft sind.
 Um die mehrere Beschränkungen auf andere Adjektive wie "schön" zu erweitern, muß eine Funktion angenommen werden, die als Argument die Eigenschaft nimmt, die das Adjektiv modifiziert. Im Augenblick erscheint der Inhalt von “schön X”,abhängig von der Bedeutung “X” zu sein.

b. Das ist ein schönes Fenster,

c. Ein schöner Anzug ist teuer.

 Der Inhalt von "schön X" ist doch nicht immer abhängig von der Bedeutung “X”. Der Anker des Parameters, der als der Wert des STANDART Attributes fungiert, muß manchmal durch kein modifiziertes Substantiv, sondern den vorzeitigen Kontext bestimmt werden.

d. Hans Castorp wurde im Berghof hier oben geröntgt. Dadurch sah er zuerst eine schöne Rippe.

Der STANDART Wert der Schönheit wird durch kein modifiziertes Substantiv (Rippe), sondern die wichtige Eigenschaft (Röntgenaufnahme) bestimmt.
 Das Adjektiv wie angeblich ist unvereinbar mit den mehreren Beschränkungsanalysen, da "angeblich X" braucht, nicht zu sein. Der lexikalische Eintrag für ein Adjektiv wie "angeblich" mag die substantivische Beschränkungsmenge als ein Argument der angeblichen Beziehung einbetten.
 Darum wird der Inhalt von N' wie angeblicher Täter als nom-obj gezeigt.

e. x1|angeblich ({Täter (x1)})

 Die Bestimmung dieses Types ist abhängig davon, daß ein bestimmtes Individuum in einem Kontext behauptet, ein Täter zu sein, trotzdem er tatsächlich kein Täter ist.
 Um die Modifizierung noch ausführlicher zu betrachten, handelt es sich hier um ein modifiziertes Idiom. Wie Gazdar et al .(1985) erklärte, betrachtete auch Hanamura (2005), ob ein Teil eines Idioms durch ein Adjektiv modifiziert werden könnte, um die Kompositionalität zu stützen. Die semantische Theorie von GPSG nahm die Semantik fiir natürliche Sprachen an, die von Montague (1973) beschrieben wurde. Nach seinem Prinzip wird jeder Baum der Phrasenstrukturen durch die Interpretation in der Form einer Transformation in die intensionale Logik begleitet.
 Eine wichtige Eigenschaft der Montague Grammatik besteht in der Begriff der Kompositionalität oder des sogenannten Fregeschen Prinzips.

f. Fregesches Prinzip
 Wenn die Bedeutungen der Bestandteile B und C erhalten werden, wird die Bedeutung von A als eine Funktion dieser Bedeutungen gehalten (SEM (α)= F (SEM (β),SEM (Y))).

Das Prinzip ist gut vereinbar mit einer Syntax, die auf einer kontextfreien Grammatik angenommen wird. In einer hierarchischen Struktur besteht ein Subbaum eines Baumes einer Phrasenstruktur aus einer Mutter und vielen Töchtern.
 B und C mögen selbst die Wurzeln anderer Subbäume in einem komplizierten Baum einer Phrasenstruktur sein. Wenn die Grammatik kontextfrei ist, entspricht der lokale Baum der folgenden Regelung.

g. A 右矢印1  B C

Das führt zum sogenannten "rule to rule" Prinzip.
 Im Gegensatz zur obengenannten Verwendungsweise der Adjektive in a, b, c und e modifiziert das attributive Adjektiv in h und i zwar morphosyntaktisch das Substantiv "Hund", aber semantisch nicht so. (Hanamura (2005))

h. auf den Hund kommen.
i. auf den leibhaftigen Hund kommen.

In i wird die Bedeutung des Idioms teilweise modifiziert. i bedeutet ungefähr, wirlclich und wahrhaftig wirtschaftlich zugrundezugehen. Hier wird ein AVM (attribute-value matrix) Diagram illustriert, weil "leibhaftig" eine Rolle einer Hecke in der Fuzzy Logik spielt. (Lakoff (1973))
 Schließlich handelt es sich weiter darum, ob ein Idiom selbst als eine Art von linguistischen Hecken angesehen werden könnte, weil Fleischer (1982) beschreibt, daß die Phraseologismen in besonderer Weise den Modalitätsparameter eines Textes wie seine Isotopie bestimmen können.

j. Idiomatisches Prinzip
 Wenn ein Idiom in einem Text verwendet wird, soll es als eine linguistische Hecke angesehen werden.
In Hanamura (2005) wird eine Idiomatizität als eine irreguläres Verhältnis zwischen der Bedeutung der Wortkomponenten und der Bedeutung des ganzen Satzes angesehen.

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より

論理文法に見るファジィらしさ7

 Wie Montague in seinem Aufsatz (Tne Proper Treatment of Quantincation in Ordinary English) bstimmte, waren die Quantoren ein wichtiges Thema in der Logico-Linguistik. HPSG behandelt sie durcn das folgende semantische Prinzip.

Semantiscnes Prinzip
 In einer köpfigen Phrase ist der CONTENT Wert merkmalidentisch mit dem Wert der Adjunkttmochter, wenn der DTRS (DAUGHTERS) Wert "head-adj-struc" (head-adjuct-structure) ist, und sonst mit dem Wert der köpfigen Tochter.

 Das Prinzip kann den CONTENT Wert für eine große Klasse von Strukturen bestimmen. Allerdings mag der Inhalt der Quantifikation durch das folgende Quantorenübernahmenprinzip ergänzend bestimmt werden.

Quantorenübernahmenprinzip
 Der QUANTIFIER-STORE (QSTORE) Wert eines Phrasenknotens ist die Vereinigung der QSTORE Werte der Töchter ausschließlich jeder Quantoren, die auf jenem Knoten nachgeschlagen werden.

 Die Prinzipien werden beschrieben, um die Beziehungen miteinander zu verstehen.
 Alle Quantoren werden durch große Phrasen übernommen und sie werden auf einer angemessenen höheren Ebene der Struktur nachgeschlagen, deren CONTENT Wert ein quantifiziertes psoa sein wird. Wenn quantifizierte psoas zuerst analysiert werden, wird der CONTENT Wert des Satzes "Ich erkläre einen
Roman” illustriert.
 Aber diese Annahme widerspricht der Formulierung des semantischen Prinzips, weil der CONTENT Wert von S nicht mehr identisch mit dem Wert seiner kopfigen Tochter ist. Deutlich muß eine Revision hier für die Prinzipien gemacht werden, die den QSTORE und den CONTENT Wert miteinander verbinden.
Zuerst wird die Merkmalstruktur von (quantifizierten) psoas wieder strukturiert. Besonders wird es vorgeschlagen, psoa (parametrized state of affairs) und qpsoa durch ein quantifiziertes psoa zu ersetzen.
 Das Hauptunterschied besteht darin, daß quantifizierte Information (QUANTIFIERS (QUANTS)) sich von keinem quantifizierten Kern (NUCLEUS) trennt. Der NUCLEUS Wert hat eine neue Sorte (quantifier-free-psoa (qfpsoa)) und der CONTENT (Ich erkläre einen Roman) wird analysiert, wenn das Etikett den Quantor bezeichnet.
 Es ist zu bemerken, daß der RESTRICTION Wert eines Quantorenindexes eine Menge von quantifizierten psoas ist, deren beide sich quantifiziert werden mögen. Der Einfachheit halber wird es abgekürzt wie folgt.

ヨx3|{Roman (x3)}

 Grundsätzlich zwingen die HPSGsche Prinzipien die Beziehung zwischen QSTORE und QUANTS, indem man so garantiert, daß die Quantoren einen Skopus zugewiesen werden, wenn sie vom Speicher abgenommen werden.
 Wenn die Quantoren sich von anderen Aspekten des Inhalts trennen, wird der NUCLEUS Wert der köpfigen Phrasen mit den NUCLEUS Werten ihrer zugehörigen Töchter identifiziert. Nur die unköpfigen Töchter sind die Komplemente. In einer Struktur eines köpfigen Adjunkten ist es die Adjunkt-Tochter. Deshalb sieht das allgemeine Prinzip, das den CONTENT Wert der köpfigen Strukturen regiert, den Begriff des semantischen Kopfes nach. Der Kopf wird definiert wie folgt.

a. Der semantische Kopf einer köpfigen Phrase
a' die Adjunkt-Tochter in einer köpfigen Adjunkt-Struktur,
a'' sonst die köpfige Tochter.

b. Inhaltsprinzip
 In einer köpfigen Struktur,
(Beispiel 1) wenn der CONTENT Wert des semantischen Kopfes "psoa" hat, ist der NUCLEUS Wert merkmalidentisch mit dem NUCLEUS Wert der Mutter;
(Beispiel 2) sonst, der CONTENT Wert des semantischen Kopfes ist merkmalidentisch mit dem CONTENT Wert der Mutter.

 Es ist zu bemerken, daß Inhaltsprinzip in zwei Fällen getrennt wird, je nachdem der CONTENT Wert des semantischen Kopfes ein psoa ist (eine Konstituente wird durch ein Verb oder durch ein prädikatives Adjektiv, Präposition oder Substantiv mit einem Kopf versehen) oder nicht (eine Konstituente wird durch ein unprädikatives Substantiv oder Präposition mit einem Kopf versehen). Der Standpunkt besteht darin, daß der NUCLEUS Wert nur in jenem Fall zwischen der Mutter und dem semantischen Kopf identifiziert wird. Das berücksichtigt das Nachschlagen des Quantors .
 Dann wird ein neues Attribut von Zeichen vorgestellt, die RETRIEVED- QUANTIFIERS (RETRIEVED) genannt werden. Der Wert wird eine Liste der Quantoren sein. Hier gibt es zwei universale Beschränkungen, deren Effekt verlangt, daß alle Quantoren im Bereich richtig liegen wie folgt.

b'. Quantorenübernahmenprinzip
 In einer köpfigen Phrase ist der RETRIEVED Wert eine Liste, deren Menge der Elemente eine Untermenge für die Vereinigung der QSTORE Werte der Töchter bildet und der Wert ist nicht leer, nur wenn der CONTENT Wert des semantischen Kopfes ein psoa hat und der QSTORE Wert das relative Komplement des RETRIEVED Wertes ist.

Das andere Prinzip wird erklärt wie folgt.

b''. Skopusprinzip
 In einer köpfigen Phrase, deren semantische Kopf ein psoa hat, ist der QUANTS Wert das Zusammenhang des RETRIEVED Wertes mit dem QUANTS Wert des semantischen Kopfes.

Das verbundene Effekt der drei Prinzipien b-b'' kann dargestellt werden wie folgt.

c. Semantisches Prinzip
 In einer köpfigen Phrase:
1. der RETRIEVED Wert ist eine Liste, deren Menge der Elemente eine Untermenge für die Vereinigung der QSTORE Werte der Töchter bildet und der QSTORE Wert ist das relative Komplement jener Menge, und
2. (Beispiel 1) wenn der semantische Kopf ein psoa hat, dann ist der NUCLEUS Wert identisch mit dem Wert des semantischen Kopfes, und der QUANTS Wert ist das Zusammenhang des RETRIEVED Wertes mit dem Wert des semantischen Kopfes;
(Beispiel 2) sonst ist der RETRIEVED Wert leer und der CONTENT Wert ist merkmalidentisch mit dem Wert des semantischen Kopfes.

 Das reformierte semantische Prinzip bereitet eine richtige Erklärung der Beziehung vor, die es zwischen QSTORE und CONTENT gibt. Zusätzlich erlaubt es einem Satz wie d, verschiedene CONTENT Werte in e und f zu haben.

d. Jeder Forscher erklärt einen Roman.

e. (∀x1|{Forscher (x1}) (∃x2|{Roman (x2)}) erklären (x1, x2)

f. (ヨx2|{Roman (x2)}) (∀x1|Forscher (x1}) erklären (x1, x2)

 Das Eflfekt des semantischen Prinzips wird illustriert, wo die Etiketten die Quantoren erwähnen. Der Einfachheit halber werden die leeren Werte für QSTORE und RETRIEVED nicht gezeigt.
 Alle Quantoren brauchen auf dem gleichen Knoten nicht nachgeschlagen zu werden oder sich auf allen Knoten einer Kategorie nicht zu leeren. Die Quantoren können im Speicher bleioen, um auf einer höheren Ebene der Struktur nachgeschlagen zu werden. Eine Möglichkeit, die durch die Analyse erlaubt wird, wird es illustriert, wenn der CONTENT Wert in g gezeigt wird.

g. (∃x2|{Roman (x2)}) denken (x8, (∀x1|{Forscher (x1}) erldären (x1, x2))

 Die Analyse des obengenannten Quantors erlaubt einem Quantor in einem VP-Komplement, einen engen Skopus in h zu nehmen, wenn das Etikett den Quantor (∀x2|{Patient (x2)}) erwähnt.

h. Behrens versucht, jeden Patienten zu befriedigen.

 Es ist zu bemerken, daß das Element des Hilfsverbs ”zu” keine leere QUANTS und NUCLEUS Werte hat, weil der lexikalische Eintrag bleibt.
 Wenn der CONTENT Wert von "zu" mit dem Wert des VP Komplementes identifiziert wird, werden der QUANTS und der NUCLEUS Wert jeweils identifiziert. Deshalb garantiert das semantische Prinzip, daß der QUANTS Wert der Phrase “jeden Patienten zu befriedigen” daraus resultiert,keinem leeren QUANTS des semantischen Kopfes "zu" die leere Liste (des nachgeschlagenen Quantors) beizufügen.

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より

論理文法に見るファジィらしさ6

 テキストの情報を処理する場合、当然のことながら文脈を意識することが重要になる。テキストの情報 は、話し手、聞き手、発話の状況および背景といった要素が一つになって動いていく。そこにはもちろん、言葉以外の様々な要素が関連してくる。従って、ここではあくまで試案として、言語外の要素のうち作者の推論を取り上げ、Thomas Mann のイロニーを考察していく。どのような作品にも作者の推論が残っており、また、 ここまで見てきた HPSG も論理学の推論と整合性が良い理論といえるからである。
 HPSG による文脈の処理について説明する。HPSG は、文脈を処理するためにCONTEXTという属性を使用し、 この属性値は、C-INDICESとBACKGROUNDという2つの属性を取る。 C-INDICESの値は、発話状況に関し言語上重要な情報を与える属性のた めに指定される。
 例えば、話し手、聞き手、発話の場所などである。BACKGROUND属性は、発話に関する適性条件と見なされる psoa の集合を値として取る。この分析により、文章は、構成要素の背景にあるすベての条件を獲得でき、それを保証するために文脈一貫性の原理(句の CONTEXT h BACKGROUND 値は、娘の CONTEXT h BACKGROUND 値の結合である)が立てられている。この原理は、発話のあらゆる部分と関連する文脈上の仮定が、発話と関連する背景の条件の一部として 継承されることを要求する。しかし、この理論は、強すぎるという欠点がある。なぜなら、発話の特定部分と関連する前提の継承を体系的に阻止する表現には適応できないからである。
 HPSGは、この問題を文脈情報に対する一般的な枠組みで処理している。前提の削除は、前節で議論したQSTOREの値から数量詞を解除す ることに似ていると述べている。実際に、NONLOCALの素性値の解除もこれに該当する例といえる。HPSGによる分析では、SLASHの束縛やRELの依存関係などもこれに相応する。
 無限の依存関係(Unbounded Dependency Construction (UDC)) は、言語表現の痕跡を扱っており、強いものと弱いものに分類されている。例え ば、Filler-Gap 構造として有名な主題化は、痕跡を埋める構成要素が以下のようにはっきりとした強い UDC である。痕跡とは、特殊な語彙項目のことであり、各接点に空の値を持った特殊な記号として現れる。この特殊な記号が痕跡である。

a. Clawdia1, we know Engelhart dislikes_1.

 この例文の痕跡については、3つのポイントがある。底部、中間部、上部。この例文の場合、最下位のVP が底部になる。しかし、底部における問題は、依存関係がどこにあるのかということである。中間部は、娘から親へと継続関係が上昇していき、最上位の Sでは、依存関係が解除される。ここで注意しなければならないことは、 文法によって束縛が要求される場合と単に束縛が継続される場合(表層の痕跡は残るから)があることである。これは、SLASH 値の集合の中でそこからさらに上昇しない要素が存在するためである。そのため、 HPSGは、次のような原理を採用している。

Nonlocal 素性原理
 それぞれの Nonlocal 素性について、親の INHERITED 値は、主要部の娘 のTO-BIND 値を除いた娘のINHERITED 値の集合になる。

 一方、弱い UDS の場合、痕跡を埋めるための構成要素 filler がはっき りとは現れない。また、痕跡とそれを埋めるための構成要素 filler が、同じ格にならないこともある。

b. Hans1 (nom) is easy to please_1(acc).

 痕跡に対応する SLASH 値は、不定詞句 VP を越えて継承されることはない。これは、この VP の親となる AP 主要部の娘 easy が、VP 不定詞句における SLASH 値の束縛を指定するためである。また、HPSGは、格の違いを統語特性ではなく、指示指標を特定する問題として処理している。
 無限の依存関係を含む言語表現として、関係詞句も議論されている。

c. to whom Hans gave a book _.

関係詞句には、2つの依存関係が同時に存在する。一つは、REL属性によりコード化される依存関係であり、また一つは、SLASH属性により コード化される filler-gap の依存関係である。しかし、wh 関係詞句の説明として、これだけでは不十分である。無限の依存関係(UDC) の上部には、さらに前章で議論したような属性 MOD に対する空でない値が存在する。つまり、c については、もう一回り大きな構造として見る必要がある。
 一般的に、関係詞句の構造は、親のN’のINHER/REL値が閉じているために空となるので、ダッシュの数は増えない。また、属性 MOD のために空でない値を記す最も簡単な方法は、関係詞句の主要部として役割を果たす音声的に空の補文化子 (complimentizer(comp)) を設定することである。HPSGは、compと区別するためにそうした要素を関係文化子 (relativizer (rltvzr)) と読んでいる。
 このような主要部一付加語の構造で、関係詞句の MOD 値は、主要部の娘の SYNSEM 値と構造を共有していなければならない。N’主要部の指標は、関係文化子 rltvzr の TO-BIND/REL 値と関係文化子 rltvzr の S 補文の INHER/REL 値と同一になる。こうした現象は、Nonlocal 素性原理を十分に反映している。
 HPSGは、前提の問題に関連して文脈変換という概念を扱っている。 これは、Groenendijk and Stokhof (1979) と Ballmer (1979) によって定義された。Groenendijk and Stokhof (1979) は、文脈を個人間の主張と見なし、 ある表現が文脈中のパラメータにより実現する概念を指して「文脈変換」と呼んでいる。一方、Ballmer (1979) は、Ranta同様、「文脈変換」の論理を直感主義論理へと拡張している。
 論理文法は、モデル理論的意味論の枠組みで指示語を扱ってきた (Montague Dexis) 。しかし、HPSGは、指示語がもつ微妙な文脈依存の関係をモデル理論で議論すること自体に無理があるとして、上述した句の中のすべての娘の C-INDICES 値が親と同一視できるという立場を主張する。しかし、これもまだ指示的な発話が持つ複雑な特徴を処理する上で十分適しているとはいえないとし、発話の各部分(語彙素) がそれ自体の C-INDICES 値を持ち、こうした値間に存在する共通性が単に発話の性質によるものだと説明している。簡単にいえば、C- INDICES 値に含まれる重要な情報は、発話内で特定されると考えられている。

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より

論理文法に見るファジィらしさ5

 修飾語の分析例として、GPSGの枠組みで構成性(フレーゲ原理)を維持するために、イディオムの一部に修飾語を付加することができるかどうか自身で試みたことがある。但し、本書では、論理文法の歴史に従って、構成性を強く意識することはない。条件文やテキストを扱うために、中間処理を意識する方向で理論が展開していくためである。GPSGは、統語論に文脈自由の句構造文法を、そして意味論にMontague 文法を採用した世界的に有名な言語理論である。ここでの問題点は、例文にあるように、形容詞 leibhaftig の形態統語的な修飾は、確かに 名詞 Hund に掛かっているが、意味的な修飾は、この名詞ではなく動詞となるというものである。

a. auf den Hund kommen.
b. auf den leibhaftigen Hunf kommen.

 それ故、本書では、leibhaftig をファジィ論理でいう一種のヘッジとして扱い、さらに、イディオム自体もヘッジと見なすことができるという立場でこの問題を処理している(イディオムの原理)。その理由は、慣用句がイゾト ピー(同位元素性)のようなテキスト内の様相パラメータを特別な方法で識別することができると考えているためである。
 HPSG をツールとした他のイディオム分析に Erbach and Krenn (1993) がある。コロケーシヨンを前提にイディオムが議論されているが、特に、量化の内容の中で記述した数量詞継承原理(Quantifier Inheritance Principle (QIP)) がイディオム分析の鍵となっている。
 まず、全体の表現の特性と見なされるイディオムは、分析不能として分類され、一方、部分的な修飾や指示的な使用が可能なためイディオムの一部に意味が割り当てられるべきものは、隠喩的として分類されています。

c. auf den Löffel abgeben.(さじを投ける、つまり、あきらめる)(分析不能)
d. in den sauce Apfel beißen. (嫌な仕事をする)(隠喩的)

c は、直接意味が割り当てられている。d は、「嫌な仕事」とden sauce Apfel (アップルソース)間および「行う」と beißen (嚙む)の間に一種の連結を作ることで理解される。
 次に、受動化や修飾といったイディオムの統語特性が取り上げられている。通常、VPを形成するイディオムは、受動化が可能だが、それによってイディオムの意味合いが薄れることがある。

e. Hans gibt den Löffel ab.
f. Der Löffel wurde von Hans abgegeben. (イデイオム性は薄れる)

修飾が可能な場合(例えば、sprichwörterlich (諺の))も、イディオム性 が薄れるようである。

g. Er gab den sprichwörterliclien Löffel ab. (イディオム性は薄れる)

逆に、隠喩的なイディオムの構成要素が修飾されても、イディオムの意味合いは薄れない。

h. Hans macht große Augen. (じろじろ見る)
i. Hans macht ganz große Augen.

つまり、Erbach and Krenn (1993) は、統語特性の計算はできても、構成要素の意味を結合する通常の関数では、意味特性の計算はできないと述べ ている。
 そこで、QIP を修正していく。分析不能なイディオム(例えば、die Leviten lesen (きつく叱る))に含まれている固定要素の die Leviten は、ユダヤ教の聖典(旧約聖書レビ記)と一種の意味関係を持っていると連想するであろう。しかし、これは、イディオムを理解する上で言語外的なことである。QIP は、意味の役割を担っていない場合でも、量化表現がリストに記述されなければならないことを義務づけている。それ故、 こうしたイディオムを語彙登録する場合、固定要素 die Leviten の意味を無視できるように、意味の役割は担っていないということを数量詞のリ ストに追記していく。

QIP
 句の接点の QUANTIFIER-STORE (QSTORE) 値は、その接点で検索される数量詞以外で意味の役割を担う娘の QSOTRE 値を結合したものになる。

 隠喩的なイディオム(ins Fettnäpfchen treten (うっかりしたことを言っ て嫌われる))についても、修正が必要である。但し、この場合は、主要部の語彙素が Fettnäpfchen であるということを指定すればよい。つま り、数、限定、量化に関して制限がないため、量化や修飾が掛かる固定要素に対して独立した意味を割り当てることになる。例えば、 Fettnäpfchen の場合は、treten 以外の動詞とも結びつくためである。 (Erbach and Krenn (1993))。そのため、固定要素に量化とか修飾が可能なイディオムは、個々の構成要素(Fettnäpfchenとtreten)に転用される意味を割り当てて、それらの意味を構成的に結びつけるように処理していく。

j. Sie muß in jeaes diplomatische rettnapfcnen treten.
(彼女は、外交面でくだらないことを言って嫌われるに違いない。)

k. In welcnes Fettnäpfchen wird sie diesmal treten?
(今回、彼女はどんなくだらないことを言うのだろう。)

l. Sie läßt kein Fettnäpfchen aus.
(彼女は、油の入った鉢を取り除かない。)

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より

論理文法に見るファジィらしさ4

 量化と同様に、修飾の問題も論理文法においてしばしば取り上げられる。ここでは、名詞を修飾す
る形容詞がテーマになる。また、それと関連してイディオムの内部を修飾する形容詞、例えば、“auf den leibhaftigen Hund kommen” の “leibhaftig” についても検討しますが、これは、フレー ゲの構成性原理がポイントになる。
 ここでは、修飾語のうち、特に名詞を修飾するまたはイディオムの一部を修飾する形容詞が議論の対象になる。まず、付加的な形容詞 「青い」の語彙登録に関するローカルな値の処理を見てみよう。指標の制限が形容詞からなる psoa と N ’主要部の名詞からなる psoa を含んだ N' を形成するために、名詞の構成要素N' と結合することになる。しばしば議論になるが、色彩用語は、その値自体が目盛りを固定する隠れたパラメータになることがある。ここでは、「青さ」を決定する尺度がそれに当たる。つまり、「青い」という関係が、付加的な役割 (STANDARD) を持っていて、その値は、文脈上で決まる特徴であり、「青さ」を決定するための標準を提供してくれる。これにより次のような形容詞に対して制約を設けることが可能になる。

a. Das ist ein schönes Fenster.
b. Ein schöner Anzug ist teuer.

 これらは、修飾する名詞と関連した特徴を変数とする関数として処理されるべきである。この立場に立つと、例えば、 “schön X”の内容は、Xの意味にかなり依存することになる。
 しかし、次のように、「美しい」の標準が、修飾される名詞(肋骨) によって決まらないことがある。

Hans Castorp wurde im Berghof hier oben geröntigt. Dadurch sah er zuerst eine schöne Rippe.

 重要な特徴(レントゲン写真)は、むしろ前述の文脈によって提供されると考えた方が自然である。標準 (STANDARD な属性値としての役割を果たすパラメータのアンカー)は、 修飾される名詞の特徴(関係)によって決まる一方、文脈に依存する場合もあるということになる。
 “angeblich” のような形容詞は、“angeblich X” が、“X” である必要がないという理由から制約と一致しないように見える。この場合、名詞の制約は、“angeblich” な関係の変数として挿入される。 そして、
“angeblicher Täter” のような N’ の内容は、nom-obj になる。この種の名詞により言及される個人は、文脈上決まるある個人が、実際に犯罪者でなくても、犯罪者であると主張したという 条件によってのみ成立するからである。

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より

論理文法に見るファジィらしさ3

 Montague の PTQ に代表されるように、量化の問題 は、論理文法においてこれまで頻繁に扱われてきた。 例えば、パージングとシュガーリング、断片的なドイツ語の文法および直感主義論理によるドイツ語の文法などである。ここでは、HPSG が採用する状況意味論に基づいた量化に関する平易な意味分析を紹介する。
 HPSG が採用しているAVM (attribute-value matrix) を使用して、量化の意味分析の例を紹介する。例文 “Ich erkläre einen Roman”(長編小説を説明する)には、素性構造と同様に統語情報として範疇や数または人称の一致などが存在し、そこに意味情報として文脈に依存する要素が重なっていく。
 まず注目したいことは、意味の原理とAVM が矛盾している点である。SのCONTENT値が、主要部の娘(VP)の値と一 致しないためである。そこで、QSTORE値とCONTENT値を関連づける原理を改訂しなければならない。BACKGROUND の素性値である psoa (parametrized state of affairs) の素性構造の表記を再度検討してみよう。内部構造を持つ psoa と古い psoa および qpsoa を交換する。 違いは、量化の情報が非量化のNUCLEUS から分離している点である。 QUANTS の値は、数量詞のリストであり、NUCLEUSの値は、量化自由 の psoa (qfpsoa) と呼ばれるものである。“Ich erkläre einen Roman” の CONTENTは、次のように分析され、タグ [4] は、数量詞となる。

QUANT[4]
NUCLEUS RELATION erkläre / ERKLAERER [2] [1st, sing] / ERKLAERT [3]
qfpsoa
psoa

 QSTOREとQUANTS 間の関係に制約を加える原理は、数量詞に対してスコープの割り当てを保証してくれる。タグ[4] は数量詞で、数量詞を他のアスペクトから切り離すと、残りの情報は、主要部の娘の NUCLEUS値と一致する。
 主要部一付加語構造では、付加語の娘が親の CONTENT 値を決定し、それ以外の場合は、主要部の娘が決定することになる。例えば、意味の主要部の CONTENT が psoa かどうかによって二分されると、親と意味の主要部間で NUCLEUS だけが特定される点が鍵になる。RETRIEVED-QUANTIFIERS と呼ばれる新しい属性が導入されると、検索された数量詞が正確に調べられるといった効果が出る。これらは、数量詞継承の原理、解釈範囲の原理と呼ばれている。こうして、矛盾があった意味の原理は、修復される。
 Pollard and Sag (1994) は、次のような例文を引いて、数量詞に関する制約をさらに課していく(数量詞束縛条件)。 これは、CONTENT値に関する広範な適格条件であり、次のように定義される。

a. One or her i students approached [each teacher] i.
b. The picture of himself i in his office delighted [each director] i.
c. [Each man] i talks to a friend of his i.

 定義:CONTENT値内に含まれた数量詞を前提として、数量詞の指標の CONTENT 値における都度の出現が、その数量詞によって捉えられなければならない。
 ここで注意すべきことは、数量詞が CONTENT 値内で出現する場所だけを、QUANTSリスト上に示していることである。但し、QUANTS リスト上にある数量詞は、指標の出現が、1) 数量詞の制限内にある、2) 同じQUANTSリスト上にある問題の数量詞の右側に現れる他の数量詞内にある、3) 問題となっている psoa のNUCLEUS 内にあるという条件付きとなる。つまり、論理形式の統語論によって意味の一般化を捉えようとする。それは、モデル理論の CONTENT 値の解釈が、制約の必要性を削減してくれるからである。条件を満たさない数量詞を含む CONTENTは、HPSG において単に解釈の対象外となっている。

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より

論理文法に見るファジィらしさ2

 HPSG の音韻論について簡単に説明する。HPSG の PHON の値は、音素の連鎖と見なされている。一般的に HPSG のような記号ベースの理論は、制限の強い音韻論を採用する。例えば、記号には音韻論と意味属性が内在しており、それらを分散するために統語属性が制限を課していくと考えている。
 各接点の属性値は、娘の属性値にとって関数となっている。これは、 範疇文法に基づいた音韻論と同様に、一 種の構成性原理を採用している。
 記号は、音韻の内容、分散するための統語的な特徴そして意味への貢献といった少なくとも3つの次元で変化している。そして、より大きな記号を形成するために別の記号と結合していく。 また、文法組織は、形態素の貯蔵庫といえるレキシコンのために存在し、 形態素の構造に対する制限は、レキシコンに関する一般化と見なすことができる。つまり、レキシコンに関する一般化が、形態素として生じる記号に応用される。
 論理文法には、自然言語と論理言語をつなぐための役割がある。また、 小説には必ず、様相、時間、存在といった推論と共有可能な情報が存在する。本書の目的は、とある作家(ここではThomas Mann) の文体がどのような推論なのかを考えていくことである。こうした言語の裏側に存在する推論を捉えるこができれば、緩衝材(ここでは PTQ など)を介して、人間とコンピュータの間に立てるロジックの方向性を決めることができる(ここではFuzzy Logic)。
 まずポイントになるのが、Richard Montague の PTQ (The Proper Treatment of Quantification in Ordinaiy English)。夕イトルにもあるように、 PTQ は、量化の問題を取り上げ、自然言語と論理言語の翻訳技法について扱っ ている。PTQは、生成文法との整合性も良く(詳細にっいては、GPSG を参照すること)、この手法を概ね理解することができれば、英語の基本表現を基にした分析樹から内包論理への変換方法と、分析樹から簡単な英語の文へのシュガーリングという二重構造も理解できる。なお、シュガーリングは、パージングと逆のプロセスになる。
 次に、直感主義論理を取り上げる。直感主義論理は、PTQ のような二重構造ではなく、シュガーリング と意味解釈に対する表現の形式化が存在するだけである。直感主義もやはり量化の問題について古典的な二値論理では対応できないという立場を取る。確かにタイプ理論が重要な役割を果たす。しかし、PTQ が考察した量化と照応だけではなく、条件文から文脈に依存するテキストのダイナミズムも視野に入れるため、本論では、PTQと類似した構造を持っMartin-Löf のタイプ理論を採用する。
 直感主義論理と同様に、ファジィ論理は多値論理の系列に属している。 1960年代前半、Zadehは、厳密な数学と曖昧な現実との矛盾に橋渡しをすべく、真理値だけではなく概念に対しても曖昧な値を導入することに成功した。こうして産声を上げたファジィ理論は、システム系の理論として成長しつつ、言語系の研究者にも注目されるようになっていく。本書では、テキストの情報を処理するために最低限必要と思われる概念、 例えば、ファジイ集合、ファジイ論理、曖昧な数字そしてファジイコン トロールなどを「魔の山」に重ねて説明していく。そして、推論の土台となる記憶や知識の問題と話を照合しつつ、「魔の山」におけるイロニ 一的な距離の問題を音の情報も含めて考察する。つまり、本書における結論は、Thomas Mannのイロニーを形式論で記述する場合、ファジ イ推論を選択することが現状ではベストであるということになる。

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より

論理文法に見るファジィらしさ1

 ここでは、HPSGが採用する記号のシステムと Montague文法を中心とした論理文法の小史が議論の対象となる。特に、テキストのダイナミズムの扱い方を問題にする際、状況意味論、パージング・シュガーリングそして直感主義論理などをベースにして、単語や句または文章を扱いながら、論理文法を実際のテキストとマージしていく。まず、Pollard and Sag (1994) の第1章よりHPSGの記号シス テムを説明する。統語論、意味論および音韻論のマージを目指したCarl PollardとIvan A. Sagの心意気が読み取れることであろう。
 HPSGの記号のシステムについて説明する。例えば、ドイツ語の人称代名詞 er を HPSG の素性構造によって表記してみよう。
 HPSGが採用する素性構造は、分類型である。各接点は、分類記号(synsemやlocalなど)によるラベルを持っており、枝分かれの方向を示す属性ラベル(PHONやSYNSEM)も存在する。さらに、 AVM (attribute-value matrix) が採用されているため、全体的にも部分的にも分類が把握しやすくなっている。例えば、LOCALだけを抽出して言語表現を考察することもできる。
 SYNSEMは、SYNTAXとSEMANTICSとういう2つの属性からなる複合情報である。SYNSEMは、例えば、補文の主語やto不定詞句の支配語が共有する情報を含むることから、特定の複合表現を単一表現に局所化する必要ができる。それが、LOCAL(LOC)である。この情報には、 CATEGORY (CAT)、CONTENT (CONT)、CONTEXT (CONX)という 3つ の属性が存在する。CATは、HEADとSUBCATという属性を含んでいる。
 HEADの値には、substantive (subst)と functional (fimct)が存在する。前者 には、名詞(noun)、動詞(verb)、形容詞(adjective)、前置詞(preposition)が、 後者には、限定子(determiner) やマーカー(complimentizer) が含まれる。名詞は、格(CASE)の素性を、前置詞は、前置詞の書式 (PFORM) を、動詞は、ブール素性(AUXILIARY (AUX)、PREDICATIVE (PRD))、置換 (INVERTED (INV)) といった属性 VFORM を持つ。SUBCATの値は、記号のバランスを示唆するもので、問題の記号が飽和状態を作る上で他にどのような記号と結合すればよいのかという指定になる。例えば、格の割り当てである。
 CONTは、INDEXと呼ばれる属性を担う nominal object (nom-obj) とい う素性構造である。“er rasiert sich”「彼は髭を剃る」という文の場合、er と sich は構造上のインデックスを共有する。“er” の CONTENT 値は personal pronoun (ppro)、“sich” の CONTENT 値は reflexive (refl) になる。この属性は、特に呼応(agreement) の問題で重要になる。さらに、意味上の制約を表すために、RESTICTION 属性を設けている。これは、バラメ 一夕寒象(parametrized state of affairs (psoa)) を考慮するためのものである。
 CONXは、BACKGROUND (BACKR)と呼ばれる context 属性を持っている。これも psoa に対応する。しかし、CONTENT値が文字通りの意味と関連するのに対して、BACKGROUND 値の方は、前提条件に対応するア ンカー条件を表している。例えば、上図の “er” は、男性を受けることが前提となっている。
 nelist (nonempty list) と elist (empty list) は、一種の素性構造である。前者には、FIRSTとRESTという二つの属性が指定される一方、後者にはいかなる属性ラベルも適応されない。また、e は、モデル化するための接点を導くものであり、便宜上、ε が存在する場合、neset ラベルを、存在しない場合、eset ラベルを担うことになる。

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より

Thomas Mannの「魔の山」のデータベース化と推定からの分析7

7 まとめ

 「魔の山」のデータベースの作り方と統計処理の推定による分析例を説明した。論理計算によるトーマス・マンとファジィというシナジーのメタファーを支えるために、データベースを作成し、実験を重ねてさらに客観性を上げていくつもりである。
 問題解決の場面には、作家の執筆脳に関する情報が見え隠れしているため、さらに他のカラムと調節しながら、考察を続けていきたい。

【参考文献】
花村嘉英 計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?
     新風舎 2005
花村嘉英 从认知语言学的角度浅析鲁迅作品−魯迅をシナジーで読む 
     華東理工大学出版社 2015
花村嘉英 森鴎外の「山椒大夫」のDB化とその分析 中国日语教学研究会江苏分会 2015
花村嘉英 森鴎外の「佐橋甚五郎」のデータベースとバラツキによる分析 
     中国日语教学研究会江苏分会 2016
花村嘉英 日本語教育のためのプログラム−中国語話者向けの教授法から森鴎外の
     データベースまで 南京東南大学出版社 2017
Mann, Thomas: Der Zauberberg, Frankfurt a. M., Fischer 1986
日本成人病予防協会監修:健康管理士一般指導員通信講座テキスト 2014
佐々木隆宏 流れるようにわかる統計学 東京:KADOKAWA 2017

花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定からの分析」より

Thomas Mannの「魔の山」のデータベース化と推定からの分析6

6 推定によるデータベースの分析

 「魔の山」のデータベースの中で、特に問題解決の場面が考察の対象となる。その中で問題解決の場面の比率は0.2とする。母集団から標本を抽出するとき、ファジィという論理計算の結果を基にして、信頼度を95%とするには、誤差を0.09以下にするのに標本はおよそいくつ必要になるのであろうか。
 標本の大きさをnとすると、標本平均と母平均との差の絶対値は95%の確立で、
1.96√0.2(1-0.2)/n 以下であるから、1.96√0.2(1-0.2)/n≦0.09 であればよい。それゆえに、
n≧76.1・・・。よって、n≧77とすればよい。
 但し、小説の構成を単純に起承転結とした場合、起承の部分には問題解決の場面が比較的少ないため、分析の対象を増やすことにより数字の調節ができると考えている。例えば、「魔の山」のデータベースから無作為に1000ラインの幅でデータを選んだ場合、比率が0.2前後になることを説明できれば、上記仮定が正しいことになる。サンプル的に100ライン単位で小さな問題解決の場面も含めて数字にしてみる。

表2 問題解決の場面数
ライン 1から100, 100から200, 200から300, 300から400, 400から500, 500から600, 600から700, 700から800, 800から900, 900から1000, 1100から1200, 1100から1200, 1200から1300, 1300から1400, 1400から1500, 1500から1600, 1600から1700, 1700から1800, 1800から1900, 1900から2000     
問題解決 3, 2, 10, 29, 21, 18, 22, 9, 11, 19, 40, 18, 18, 28, 25, 32, 28, 25, 47, 13
の場面   

 理論的には、n≧77であるから、1600越えぐらいで400となればよい。現状のデータベースでは1800越えであるため多少の修正が必要である。そこで、比率を0.25にすると、n≧89.2となり、表2の数字に近くなるため、問題解決の場面の比率は、0.25ぐらいで良いであろう。

花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定からの分析」より

ファン
検索
<< 2024年09月 >>
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          
最新記事
写真ギャラリー
最新コメント
タグクラウド
カテゴリーアーカイブ
プロフィール
花村嘉英さんの画像
花村嘉英
花村嘉英(はなむら よしひさ) 1961年生まれ、立教大学大学院文学研究科博士後期課程(ドイツ語学専攻)在学中に渡独。 1989年からドイツ・チュービンゲン大学に留学し、同大大学院新文献学部博士課程でドイツ語学・言語学(意味論)を専攻。帰国後、技術文(ドイツ語、英語)の機械翻訳に従事する。 2009年より中国の大学で日本語を教える傍ら、比較言語学(ドイツ語、英語、中国語、日本語)、文体論、シナジー論、翻訳学の研究を進める。テーマは、データベースを作成するテキスト共生に基づいたマクロの文学分析である。 著書に「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」(新風舎:出版証明書付)、「从认知语言学的角度浅析鲁迅作品−魯迅をシナジーで読む」(華東理工大学出版社)、「日本語教育のためのプログラム−中国語話者向けの教授法から森鴎外のデータベースまで(日语教育计划书−面向中国人的日语教学法与森鸥外小说的数据库应用)」南京東南大学出版社、「从认知语言学的角度浅析纳丁・戈迪默-ナディン・ゴーディマと意欲」華東理工大学出版社、「計算文学入門(改訂版)−シナジーのメタファーの原点を探る」(V2ソリューション)、「小説をシナジーで読む 魯迅から莫言へーシナジーのメタファーのために」(V2ソリューション)がある。 論文には「論理文法の基礎−主要部駆動句構造文法のドイツ語への適用」、「人文科学から見た技術文の翻訳技法」、「サピアの『言語』と魯迅の『阿Q正伝』−魯迅とカオス」などがある。 学術関連表彰 栄誉証書 文献学 南京農業大学(2017年)、大連外国語大学(2017年)
プロフィール
×

この広告は30日以上新しい記事の更新がないブログに表示されております。