アフィリエイト広告を利用しています

広告

この広告は30日以上更新がないブログに表示されております。
新規記事の投稿を行うことで、非表示にすることが可能です。
posted by fanblog

2017年12月09日

Thomas Mannの「魔の山」のデータベース化と推定からの分析6

6 推定によるデータベースの分析

 「魔の山」のデータベースの中で、特に問題解決の場面が考察の対象となる。その中で問題解決の場面の比率は0.2とする。母集団から標本を抽出するとき、ファジィという論理計算の結果を基にして、信頼度を95%とするには、誤差を0.09以下にするのに標本はおよそいくつ必要になるのであろうか。
 標本の大きさをnとすると、標本平均と母平均との差の絶対値は95%の確立で、
1.96√0.2(1-0.2)/n 以下であるから、1.96√0.2(1-0.2)/n≦0.09 であればよい。それゆえに、
n≧76.1・・・。よって、n≧77とすればよい。
 但し、小説の構成を単純に起承転結とした場合、起承の部分には問題解決の場面が比較的少ないため、分析の対象を増やすことにより数字の調節ができると考えている。例えば、「魔の山」のデータベースから無作為に1000ラインの幅でデータを選んだ場合、比率が0.2前後になることを説明できれば、上記仮定が正しいことになる。サンプル的に100ライン単位で小さな問題解決の場面も含めて数字にしてみる。

表2 問題解決の場面数
ライン 1から100, 100から200, 200から300, 300から400, 400から500, 500から600, 600から700, 700から800, 800から900, 900から1000, 1100から1200, 1100から1200, 1200から1300, 1300から1400, 1400から1500, 1500から1600, 1600から1700, 1700から1800, 1800から1900, 1900から2000     
問題解決 3, 2, 10, 29, 21, 18, 22, 9, 11, 19, 40, 18, 18, 28, 25, 32, 28, 25, 47, 13
の場面   

 理論的には、n≧77であるから、1600越えぐらいで400となればよい。現状のデータベースでは1800越えであるため多少の修正が必要である。そこで、比率を0.25にすると、n≧89.2となり、表2の数字に近くなるため、問題解決の場面の比率は、0.25ぐらいで良いであろう。

花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定からの分析」より

Thomas Mannの「魔の山」のデータベース化と推定による分析5

5 DBの作成法と分析

 DBの作成法について説明する。エクセルのデータについては、列の前半(文法1から意味5)が構文や意味の解析データ、後半(医学情報から人工知能)が理系に寄せる生成のデータである。一応、L(受容と共生)を反映している。DBの数字は、登場人物を動かしながら考えている。こうしたDBを作る場合、共生のカラムの設定が難しい。受容はそれぞれの言語ごとに構文と意味を解析し、何かの組を作ればよい。しかし、共生は作家の知的財産に基く脳の活動が問題になるため、作家ごとにカラムが変わる。執筆脳は、問題解決の場面で強くなる。(花村2015、花村2017)作成したDBの大きさは、およそ5000ラインである。 

表1 魔の山のDBのカラム

項目名    内容              説明
文法1    量化         不定代名詞、相互代名詞。
文法2    態           能動、受動、使役。
文法3    時制、相       現在、過去、未来、進行形、完了形。
文法4    様相         可能、推量、必然、義務など。
文法5   イディオム       様相の拡大。
意味1     個性         若い、背が高い、我慢強いなど。
意味2      距離         現実的または心理的に近い、中位、遠い
意味3     五感         視覚、聴覚、味覚、嗅覚、触覚
意味4     振舞い         振舞い
意味5     数字         いろいろな数字。
医学情報  病跡学との接点     受容と共生の共有点。構文や意味の解析から得た組               「イロニーとファジィ」と病跡学でリンクを張るためにメディカル情報を入れる。
記憶  短期、作業記憶、長期(陳述と非陳述)  作品から読み取れる記憶を拾う。長期記憶は陳述と非陳述に分類される。  
認知プロセス1   感覚情報の捉え方  感覚器官からの情報に注目するため、対象の捉え方が問題になる。例えば、ベースとプロファイルやグループ化または条件反射。
認知プロセス2  記憶と学習  外部からの情報を既存の知識構造に組み込む。その際、未知の情報についてはカテゴリー化する。学習につながるため。
認知プロセス3  計画、問題解決、推論  受け取った情報は、計画を立てるときにも役に立つ。目的に応じて問題を分析し、解決策を探っていく。獲得した情報が完全でない場合、推論が必要になる。
人工知能1 ファジィ、ニューラル 「イロニーとファジィ」が入力で、「ファジィとニューラル」が出力となる。             
人工知能2 エキスパート リスク回避を目的とした行動に注目する。     

花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定による分析」より

Thomas Mannの「魔の山」のデータベース化と推定による分析4

4 トーマス・マンの脳の活動はファジィ

 トーマス・マンは、散文の条件として常に現実から距離を置く。一つには、現実をできるだけ正確に考察するために、また一つには、それを批判するために、つまり、イロニー的に。この批判的な距離は、イロニー的な距離となりうるだろう。実際、批判的な表現における簡潔さには、余すところなく正確に規定された概念言語の要求に対して、言語媒体そのものの特徴から反対の行動をとるある種の制限が設定されている。
 ザデーはファジィを次のように定義する。正確さと複雑さは両立が困難である。システムの複雑さが増すと、その振舞いについて性格ではっきりとした主張は出来なくなってくる。例えば、現実の経済と関連したシステムの振舞いを推測することは、大変に難しい。
 つまり、両者とも、物事を深く正確に突き止めていってもそこには限界があり、逆に深追いしないことにより、より良い結果をもたらすことができると主張している。トーマス・マンのイロニーとファジィ理論の整合性については、著作の中ですでに実証済みである。(花村2015、花村2017)

花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定による分析」より

Thomas Mannの「魔の山」のデータベース化と推定による分析3

3 データベースを作成するフローチャート

@ 知的財産が自分と近い作家を選択する。
A 場面のイメージのDBを作成する。場面が浮かぶように話をまとめる。
B 解析イメージから何かの組を作る。言語解析は構文と意味が対象になる。
C 認知科学のモデルは、Lのプロセス全体に適用される。例、前半は言語の分析、後半は情報の分析。
D 場面ごとに問題の解決と未解決を確認する。
E 問題解決の場面では、Lに縦横滑ってCに到達後、解析イメージに戻る。問題未解決の場面では、すぐに解析イメージに戻る。
F 各分野の専門家が思い描くリスク回避を参考にしながら、作家の執筆時の脳の活動を想定する。
G 問題解決の場面を中心にして、テキストの共生について考察する。

@、A、Bは受容の読みのプロセス、Cは認知科学の前半と後半、D、Eは異質のCとのイメージ合わせになり、Fで作家の脳の活動を探り、Gでシナジーのメタファーに到達する。DBの作成については、これらが全て収まるようにカラムを工夫すること。

@  一文一文解析しながら、選択した作家の知的財産を追っていく。例えば、受容の段階で文体などの平易な読みを想定し、共生の段階で知的財産に纏わる異質のCを探る。この作業はAとBでも行われる。
A  場面のイメージが浮かぶような対照表を作る。
B  テキストの解析を何れかの組にする。例えば、トーマス・マンは「イロニーとファジィ」、魯迅は「馬虎と記憶」という組にする。組が見つからなければ、@からBのプロセスを繰り返す。
C  認知プロセスの前半と後半を確認する。
D  場面の情報の流れを考える。問題解決と問題未解決で場面を分ける。
E  問題解決の場面は、異質のCに到達後、解析イメージにリターンする。問題未解決の場面は、すぐに解析イメージにリターンする。こう考えると、システムがスムーズになる。
F  各分野のエキスパートが思い描くリスク回避と意志決定がテーマである。緊急着陸、救急医療、株式市場、環境問題などから生成イメージにつながるようにリスク回避のポイントを作る。そこから、作家の意思決定を考える。
G  これにより作家の脳の活動の一例といえるシナジーのメタファーが作られる。「トーマス・マンとファジィ」というシナジーのメタファーは、テキスト共生に基づいた組のアンサンブルであり、文学をマクロに考えるための方法である。

花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定による分析」より




Thomas Mannの「魔の山」のデータベース化と推定による分析2

2 フォーマットL

 上記の「計算文学入門」を書きながら、小説を読んで思うという分析は、縦に言語、文学の流れとなり、続けて横にイロニーに関する情報の分析があることに気がついた。つまり、文型と理系の間にTの逆さで認知科学を想定して、人文科学と縦に二本の柱を作るファーマットを崩して、縦に言語、文学を分析する認知と横に情報を分析する認知と区別することにより、研究のフォーマットをLにシフトした。
 研究のフォーマットのシフトは、また、文学をマクロに考察する場合に役に立つ。一般的に地球規模の研究、文学では、東西南北の国地域の比較を言葉を変えながら作品を分析することがマクロの評価項目の一つである。そこに、伝統的な人文、文化、社会の比較とかシステムとメディカルの比較のみならず、フォーマットLも考慮に入れる。
 フォーマットLを評価項目に加えることにより、通常、ボトムアップだけで実績を作るところに、トップダウンで主の専門以外の系列が零点にならないような調整が必要になってくる。また、技術文の翻訳作業による理系のアイデアの調節も生きてくる。小説に関するLのストーリーを使用してDBを作成する場合、エクセルデータの横のラインがリレーショナルになるように、文系と理系のカラムを設けるためである。理系のカラムを設定するには、何れかの理系の実績が必要になるためである。(花村2015、花村2017、花村2018、花村2022)

花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定による分析」より

Thomas Mannの「魔の山」のデータベース化と推定による分析1

1 自作の入門について

 1989年から1990年代前半にかけて、ドイツのチュービンゲン大学に留学し、意味論を研究した。当時の私の研究テーマは、論理文法で有名なモンターギュ文法を使用したテキスト分析であった。モンターギュ文法は、認知科学の枠組みで言語理論の研究者が、生成文法と組み合わせて構文と意味を解析するために取り組んでいた。
 研究の題材は、トーマス・マンの「魔の山」であり、作品を読みながらドイツ語の構文と意味の解析について分析し、トーマス・マンのイロニーを説明した。しかし、ここで思うことがあった。トーマス・マンのイロニーが理解できるのは、ドイツ語の習得が進んだからであろうか。
 作家が作品を執筆しているときには、当然、何れかの脳の活動がある。トーマス・マンの場合もそれが何かであり、読んで思うイロニーもそこに近づいていくため、内容が理解できると思うようになった。読んで思うトーマス・マンのイロニーは、人工知能でいうファジィ推論に近いことを「魔の山」のいくつかの場面を例にして説明することができた。
 ドイツから帰国後、英日、独日の技術文の翻訳作業に10年余り従事した。文系から寄せて理系のアイデアを調節する機会を得るためである。こうして、2005年、「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」という研究本を出版することができた。

花村嘉英(2017)「Thomas Mannの「魔の山」のデータベース化と推定による分析」より

2017年10月31日

論理文法に見るファジィらしさ8

 Zuerst handelt es sich um das CONTEX Attribut. Der 'Wert des Attributes nimmt zwei Attribute C-INDICES und BACKGROUND. Die C-INDICES Werte werden für viele Attribute spezinziert, die die linguistische wichtige Information über die Zustände einer Äußerung wie z.B. SPEAKER, ADDRESSEE und UTTERANCE-LOCATION (U-LOC) geben. Das BACKGROUND Attribut nimmt eine Menge von psoas für die angemessenen Bedingungen, die mit einer Äußerung eines gegebenen Types einer Phrase verbunden werden. Die Objekte eines Kontextes werden illustriert. (Hanamura (2005))
 Zum Beispiel weiß man, daß ein gegebener Satz alle Hintergrundbedingungen der Bestandteile erwirbt. Die einfachste Weise für die Analyse würde das folgende Prinzip begründen.

a. Kontextuelles Konsequenzprinzip 
 Der CONTEXT/BACKGROUND Wert einer gegebenen Phrase ist die Vereinigung der CONTEXT/BACKGROUND Werte der Töchter.

 Das Prinzip in a verlangt, daß alle kontextuellen Annahmen als ein Teil der Menge von Hintergrundbedingungen übernommen werden.
 Das Prinzip ist doch eine ganz starke Theorie über die Präsuppositionsübernahme. Das heißt, es erscheint inkorrekt zu sein, weil es keine Ausdrücke erlauben kann, die die Übernahme der Präsuppositionen systematisch versperren, die mit einer partiellen Äußerung verbunden werden. Der Unterschied zwischen b und c besteht darin, daß nur jener als eine Präsupposition die Proposition hat, die durch d ausgedrückt wird.

b. Hans Castorp bedauert, daß Joachim Ziemßen krank ist.

c. Wenn Joachim Ziemßen krank ist, dann Hans Castorp bedauert, daß Joachim Ziemßen krank ist.

d. Joachim Ziemßen ist krank.

 Um das Problem zu lösen, handelt es sich hier um das allgemeine System für kontextuelle Information. Die Streichung der Präsuppositionen trägt eine Ähnlichkeit mit der Entlassung der Quantoren aus QSTORE Werten. In der Tat ist es ähnlich der Entlassung von NONLOCAL Werten, die in der Analyse der Bedingung von SLASH und REL Dependenzen betrachtet werden, wenn das Prinzip für kontextuelle Konsequenz geschieht, die die spezifischen Elemente wie z.B. “plugs in Hanamura (2005) erlaubt, um einen Mitglieder aus der übernommenen Menge angemessener Bedingungen zu entlassen. Das ist doch keine absolute Sache.
 Ferner beschreibt Pollard and Sag (1994) deiktische Spracherscheinungen. Jedes Wort einer Äußerung führt die kontextuellen Parameter ein, die wichtig für die Interpretation der deiktischen Ausdrücke sind. In der traditionellen Denkweise wird kontextuelle Information in die modelltheoretische Semantik der natürlichen Sprache gebracht. Allerdings ist sie der feinen Natur der deiktischen Kontextdependenz nicht gerecht. HPSG identifiziert den C-INDECES Wert aller Töchter in einer gegebenen Phrase mit dem Wert der Mutter.
 Pollard and Sag (1994) nimmt an, daß jeder Teil einer Äußerung den eigenen C- INDECES Wert hat and daß das gemeinsame Charakter zwischen solchen Werten auf die Natur von Äußerungen zurückgeführt wird. Das heißt, alle wichtigen Informationen über C-INDECES Werte werden innerhalb einer Äußerung identifiziert. Die ganzen Werte von C-INDECES werden zwar identifiziert, aber es ist unabhängig von der Bedingungen im linguistischen System. Solche Bedingungen werden aufgrund typischer Eigenschaften von “discourse situation" - Tendenzen außerhalb Sprachen - unterstützt.

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より


論理文法に見るファジィらしさ7

 Hier handelt es sich um den lokalisierten Wert des lexikalischen Eintrags für ein attributives Adjektiv (z.B. blau), um die neue OUANTS/NUCLEUS Kodierung von psoas zu reflektieren.
 Die Interpretation des Adjektivs wie "blau" wird gezeigt.

a. x1|{Auge (x1), blau (x1)}

 Es erlegt dem Anker eines Parameters mehrere Beschränkungen auf. Wie es manchmal gesagt wird, zeigen die farbigen Beziehungen einen verdeckten Parameter, dessen Wert eine Skale der Farbe fixiert, sowie die Extensionen von “measure adjectives” abhängig von der Bestimmungen eines Maßstabs, eines Vergleichs und einer Norm für die Klasse der gemessenen Eigenschaft sind.
 Um die mehrere Beschränkungen auf andere Adjektive wie "schön" zu erweitern, muß eine Funktion angenommen werden, die als Argument die Eigenschaft nimmt, die das Adjektiv modifiziert. Im Augenblick erscheint der Inhalt von “schön X”,abhängig von der Bedeutung “X” zu sein.

b. Das ist ein schönes Fenster,

c. Ein schöner Anzug ist teuer.

 Der Inhalt von "schön X" ist doch nicht immer abhängig von der Bedeutung “X”. Der Anker des Parameters, der als der Wert des STANDART Attributes fungiert, muß manchmal durch kein modifiziertes Substantiv, sondern den vorzeitigen Kontext bestimmt werden.

d. Hans Castorp wurde im Berghof hier oben geröntgt. Dadurch sah er zuerst eine schöne Rippe.

Der STANDART Wert der Schönheit wird durch kein modifiziertes Substantiv (Rippe), sondern die wichtige Eigenschaft (Röntgenaufnahme) bestimmt.
 Das Adjektiv wie angeblich ist unvereinbar mit den mehreren Beschränkungsanalysen, da "angeblich X" braucht, nicht zu sein. Der lexikalische Eintrag für ein Adjektiv wie "angeblich" mag die substantivische Beschränkungsmenge als ein Argument der angeblichen Beziehung einbetten.
 Darum wird der Inhalt von N' wie angeblicher Täter als nom-obj gezeigt.

e. x1|angeblich ({Täter (x1)})

 Die Bestimmung dieses Types ist abhängig davon, daß ein bestimmtes Individuum in einem Kontext behauptet, ein Täter zu sein, trotzdem er tatsächlich kein Täter ist.
 Um die Modifizierung noch ausführlicher zu betrachten, handelt es sich hier um ein modifiziertes Idiom. Wie Gazdar et al .(1985) erklärte, betrachtete auch Hanamura (2005), ob ein Teil eines Idioms durch ein Adjektiv modifiziert werden könnte, um die Kompositionalität zu stützen. Die semantische Theorie von GPSG nahm die Semantik fiir natürliche Sprachen an, die von Montague (1973) beschrieben wurde. Nach seinem Prinzip wird jeder Baum der Phrasenstrukturen durch die Interpretation in der Form einer Transformation in die intensionale Logik begleitet.
 Eine wichtige Eigenschaft der Montague Grammatik besteht in der Begriff der Kompositionalität oder des sogenannten Fregeschen Prinzips.

f. Fregesches Prinzip
 Wenn die Bedeutungen der Bestandteile B und C erhalten werden, wird die Bedeutung von A als eine Funktion dieser Bedeutungen gehalten (SEM (α)= F (SEM (β),SEM (Y))).

Das Prinzip ist gut vereinbar mit einer Syntax, die auf einer kontextfreien Grammatik angenommen wird. In einer hierarchischen Struktur besteht ein Subbaum eines Baumes einer Phrasenstruktur aus einer Mutter und vielen Töchtern.
 B und C mögen selbst die Wurzeln anderer Subbäume in einem komplizierten Baum einer Phrasenstruktur sein. Wenn die Grammatik kontextfrei ist, entspricht der lokale Baum der folgenden Regelung.

g. A 右矢印1  B C

Das führt zum sogenannten "rule to rule" Prinzip.
 Im Gegensatz zur obengenannten Verwendungsweise der Adjektive in a, b, c und e modifiziert das attributive Adjektiv in h und i zwar morphosyntaktisch das Substantiv "Hund", aber semantisch nicht so. (Hanamura (2005))

h. auf den Hund kommen.
i. auf den leibhaftigen Hund kommen.

In i wird die Bedeutung des Idioms teilweise modifiziert. i bedeutet ungefähr, wirlclich und wahrhaftig wirtschaftlich zugrundezugehen. Hier wird ein AVM (attribute-value matrix) Diagram illustriert, weil "leibhaftig" eine Rolle einer Hecke in der Fuzzy Logik spielt. (Lakoff (1973))
 Schließlich handelt es sich weiter darum, ob ein Idiom selbst als eine Art von linguistischen Hecken angesehen werden könnte, weil Fleischer (1982) beschreibt, daß die Phraseologismen in besonderer Weise den Modalitätsparameter eines Textes wie seine Isotopie bestimmen können.

j. Idiomatisches Prinzip
 Wenn ein Idiom in einem Text verwendet wird, soll es als eine linguistische Hecke angesehen werden.
In Hanamura (2005) wird eine Idiomatizität als eine irreguläres Verhältnis zwischen der Bedeutung der Wortkomponenten und der Bedeutung des ganzen Satzes angesehen.

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より

2017年10月30日

論理文法に見るファジィらしさ6

 Wie Montague in seinem Aufsatz (Tne Proper Treatment of Quantincation in Ordinary English) bstimmte, waren die Quantoren ein wichtiges Thema in der Logico-Linguistik. HPSG behandelt sie durcn das folgende semantische Prinzip.

Semantiscnes Prinzip
 In einer köpfigen Phrase ist der CONTENT Wert merkmalidentisch mit dem Wert der Adjunkttmochter, wenn der DTRS (DAUGHTERS) Wert "head-adj-struc" (head-adjuct-structure) ist, und sonst mit dem Wert der köpfigen Tochter.

 Das Prinzip kann den CONTENT Wert für eine große Klasse von Strukturen bestimmen. Allerdings mag der Inhalt der Quantifikation durch das folgende Quantorenübernahmenprinzip ergänzend bestimmt werden.

Quantorenübernahmenprinzip
 Der QUANTIFIER-STORE (QSTORE) Wert eines Phrasenknotens ist die Vereinigung der QSTORE Werte der Töchter ausschließlich jeder Quantoren, die auf jenem Knoten nachgeschlagen werden.

 Die Prinzipien werden beschrieben, um die Beziehungen miteinander zu verstehen.
 Alle Quantoren werden durch große Phrasen übernommen und sie werden auf einer angemessenen höheren Ebene der Struktur nachgeschlagen, deren CONTENT Wert ein quantifiziertes psoa sein wird. Wenn quantifizierte psoas zuerst analysiert werden, wird der CONTENT Wert des Satzes "Ich erkläre einen
Roman” illustriert.
 Aber diese Annahme widerspricht der Formulierung des semantischen Prinzips, weil der CONTENT Wert von S nicht mehr identisch mit dem Wert seiner kopfigen Tochter ist. Deutlich muß eine Revision hier für die Prinzipien gemacht werden, die den QSTORE und den CONTENT Wert miteinander verbinden.
Zuerst wird die Merkmalstruktur von (quantifizierten) psoas wieder strukturiert. Besonders wird es vorgeschlagen, psoa (parametrized state of affairs) und qpsoa durch ein quantifiziertes psoa zu ersetzen.
 Das Hauptunterschied besteht darin, daß quantifizierte Information (QUANTIFIERS (QUANTS)) sich von keinem quantifizierten Kern (NUCLEUS) trennt. Der NUCLEUS Wert hat eine neue Sorte (quantifier-free-psoa (qfpsoa)) und der CONTENT (Ich erkläre einen Roman) wird analysiert, wenn das Etikett den Quantor bezeichnet.
 Es ist zu bemerken, daß der RESTRICTION Wert eines Quantorenindexes eine Menge von quantifizierten psoas ist, deren beide sich quantifiziert werden mögen. Der Einfachheit halber wird es abgekürzt wie folgt.

ヨx3|{Roman (x3)}

 Grundsätzlich zwingen die HPSGsche Prinzipien die Beziehung zwischen QSTORE und QUANTS, indem man so garantiert, daß die Quantoren einen Skopus zugewiesen werden, wenn sie vom Speicher abgenommen werden.
 Wenn die Quantoren sich von anderen Aspekten des Inhalts trennen, wird der NUCLEUS Wert der köpfigen Phrasen mit den NUCLEUS Werten ihrer zugehörigen Töchter identifiziert. Nur die unköpfigen Töchter sind die Komplemente. In einer Struktur eines köpfigen Adjunkten ist es die Adjunkt-Tochter. Deshalb sieht das allgemeine Prinzip, das den CONTENT Wert der köpfigen Strukturen regiert, den Begriff des semantischen Kopfes nach. Der Kopf wird definiert wie folgt.

a. Der semantische Kopf einer köpfigen Phrase
a' die Adjunkt-Tochter in einer köpfigen Adjunkt-Struktur,
a'' sonst die köpfige Tochter.

b. Inhaltsprinzip
 In einer köpfigen Struktur,
(Beispiel 1) wenn der CONTENT Wert des semantischen Kopfes "psoa" hat, ist der NUCLEUS Wert merkmalidentisch mit dem NUCLEUS Wert der Mutter;
(Beispiel 2) sonst, der CONTENT Wert des semantischen Kopfes ist merkmalidentisch mit dem CONTENT Wert der Mutter.

 Es ist zu bemerken, daß Inhaltsprinzip in zwei Fällen getrennt wird, je nachdem der CONTENT Wert des semantischen Kopfes ein psoa ist (eine Konstituente wird durch ein Verb oder durch ein prädikatives Adjektiv, Präposition oder Substantiv mit einem Kopf versehen) oder nicht (eine Konstituente wird durch ein unprädikatives Substantiv oder Präposition mit einem Kopf versehen). Der Standpunkt besteht darin, daß der NUCLEUS Wert nur in jenem Fall zwischen der Mutter und dem semantischen Kopf identifiziert wird. Das berücksichtigt das Nachschlagen des Quantors .
 Dann wird ein neues Attribut von Zeichen vorgestellt, die RETRIEVED- QUANTIFIERS (RETRIEVED) genannt werden. Der Wert wird eine Liste der Quantoren sein. Hier gibt es zwei universale Beschränkungen, deren Effekt verlangt, daß alle Quantoren im Bereich richtig liegen wie folgt.

b'. Quantorenübernahmenprinzip
 In einer köpfigen Phrase ist der RETRIEVED Wert eine Liste, deren Menge der Elemente eine Untermenge für die Vereinigung der QSTORE Werte der Töchter bildet und der Wert ist nicht leer, nur wenn der CONTENT Wert des semantischen Kopfes ein psoa hat und der QSTORE Wert das relative Komplement des RETRIEVED Wertes ist.

Das andere Prinzip wird erklärt wie folgt.

b''. Skopusprinzip
 In einer köpfigen Phrase, deren semantische Kopf ein psoa hat, ist der QUANTS Wert das Zusammenhang des RETRIEVED Wertes mit dem QUANTS Wert des semantischen Kopfes.

Das verbundene Effekt der drei Prinzipien b-b'' kann dargestellt werden wie folgt.

c. Semantisches Prinzip
 In einer köpfigen Phrase:
1. der RETRIEVED Wert ist eine Liste, deren Menge der Elemente eine Untermenge für die Vereinigung der QSTORE Werte der Töchter bildet und der QSTORE Wert ist das relative Komplement jener Menge, und
2. (Beispiel 1) wenn der semantische Kopf ein psoa hat, dann ist der NUCLEUS Wert identisch mit dem Wert des semantischen Kopfes, und der QUANTS Wert ist das Zusammenhang des RETRIEVED Wertes mit dem Wert des semantischen Kopfes;
(Beispiel 2) sonst ist der RETRIEVED Wert leer und der CONTENT Wert ist merkmalidentisch mit dem Wert des semantischen Kopfes.

 Das reformierte semantische Prinzip bereitet eine richtige Erklärung der Beziehung vor, die es zwischen QSTORE und CONTENT gibt. Zusätzlich erlaubt es einem Satz wie d, verschiedene CONTENT Werte in e und f zu haben.

d. Jeder Forscher erklärt einen Roman.

e. (∀x1|{Forscher (x1}) (∃x2|{Roman (x2)}) erklären (x1, x2)

f. (ヨx2|{Roman (x2)}) (∀x1|Forscher (x1}) erklären (x1, x2)

 Das Eflfekt des semantischen Prinzips wird illustriert, wo die Etiketten die Quantoren erwähnen. Der Einfachheit halber werden die leeren Werte für QSTORE und RETRIEVED nicht gezeigt.
 Alle Quantoren brauchen auf dem gleichen Knoten nicht nachgeschlagen zu werden oder sich auf allen Knoten einer Kategorie nicht zu leeren. Die Quantoren können im Speicher bleioen, um auf einer höheren Ebene der Struktur nachgeschlagen zu werden. Eine Möglichkeit, die durch die Analyse erlaubt wird, wird es illustriert, wenn der CONTENT Wert in g gezeigt wird.

g. (∃x2|{Roman (x2)}) denken (x8, (∀x1|{Forscher (x1}) erldären (x1, x2))

 Die Analyse des obengenannten Quantors erlaubt einem Quantor in einem VP-Komplement, einen engen Skopus in h zu nehmen, wenn das Etikett den Quantor (∀x2|{Patient (x2)}) erwähnt.

h. Behrens versucht, jeden Patienten zu befriedigen.

 Es ist zu bemerken, daß das Element des Hilfsverbs ”zu” keine leere QUANTS und NUCLEUS Werte hat, weil der lexikalische Eintrag bleibt.
 Wenn der CONTENT Wert von "zu" mit dem Wert des VP Komplementes identifiziert wird, werden der QUANTS und der NUCLEUS Wert jeweils identifiziert. Deshalb garantiert das semantische Prinzip, daß der QUANTS Wert der Phrase “jeden Patienten zu befriedigen” daraus resultiert,keinem leeren QUANTS des semantischen Kopfes "zu" die leere Liste (des nachgeschlagenen Quantors) beizufügen.

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より


2017年10月29日

論理文法に見るファジィらしさ5

 テキストの情報を処理する場合、当然のことながら文脈を意識することが重要になる。テキストの情報 は、話し手、聞き手、発話の状況および背景といった要素が一つになって動いていく。そこにはもちろん、言葉以外の様々な要素が関連してくる。従って、ここではあくまで試案として、言語外の要素のうち作者の推論を取り上げ、Thomas Mann のイロニーを考察していく。どのような作品にも作者の推論が残っており、また、 ここまで見てきた HPSG も論理学の推論と整合性が良い理論といえるからである。
 HPSG による文脈の処理について説明する。HPSG は、文脈を処理するためにCONTEXTという属性を使用し、 この属性値は、C-INDICESとBACKGROUNDという2つの属性を取る。 C-INDICESの値は、発話状況に関し言語上重要な情報を与える属性のた めに指定される。
 例えば、話し手、聞き手、発話の場所などである。BACKGROUND属性は、発話に関する適性条件と見なされる psoa の集合を値として取る。この分析により、文章は、構成要素の背景にあるすベての条件を獲得でき、それを保証するために文脈一貫性の原理(句の CONTEXT h BACKGROUND 値は、娘の CONTEXT h BACKGROUND 値の結合である)が立てられている。この原理は、発話のあらゆる部分と関連する文脈上の仮定が、発話と関連する背景の条件の一部として 継承されることを要求する。しかし、この理論は、強すぎるという欠点がある。なぜなら、発話の特定部分と関連する前提の継承を体系的に阻止する表現には適応できないからである。
 HPSGは、この問題を文脈情報に対する一般的な枠組みで処理している。前提の削除は、前節で議論したQSTOREの値から数量詞を解除す ることに似ていると述べている。実際に、NONLOCALの素性値の解除もこれに該当する例といえる。HPSGによる分析では、SLASHの束縛やRELの依存関係などもこれに相応する。
 無限の依存関係(Unbounded Dependency Construction (UDC)) は、言語表現の痕跡を扱っており、強いものと弱いものに分類されている。例え ば、Filler-Gap 構造として有名な主題化は、痕跡を埋める構成要素が以下のようにはっきりとした強い UDC である。痕跡とは、特殊な語彙項目のことであり、各接点に空の値を持った特殊な記号として現れる。この特殊な記号が痕跡である。

a. Clawdia1, we know Engelhart dislikes_1.

 この例文の痕跡については、3つのポイントがある。底部、中間部、上部。この例文の場合、最下位のVP が底部になる。しかし、底部における問題は、依存関係がどこにあるのかということである。中間部は、娘から親へと継続関係が上昇していき、最上位の Sでは、依存関係が解除される。ここで注意しなければならないことは、 文法によって束縛が要求される場合と単に束縛が継続される場合(表層の痕跡は残るから)があることである。これは、SLASH 値の集合の中でそこからさらに上昇しない要素が存在するためである。そのため、 HPSGは、次のような原理を採用している。

Nonlocal 素性原理
 それぞれの Nonlocal 素性について、親の INHERITED 値は、主要部の娘 のTO-BIND 値を除いた娘のINHERITED 値の集合になる。

 一方、弱い UDS の場合、痕跡を埋めるための構成要素 filler がはっき りとは現れない。また、痕跡とそれを埋めるための構成要素 filler が、同じ格にならないこともある。

b. Hans1 (nom) is easy to please_1(acc).

 痕跡に対応する SLASH 値は、不定詞句 VP を越えて継承されることはない。これは、この VP の親となる AP 主要部の娘 easy が、VP 不定詞句における SLASH 値の束縛を指定するためである。また、HPSGは、格の違いを統語特性ではなく、指示指標を特定する問題として処理している。
 無限の依存関係を含む言語表現として、関係詞句も議論されている。

c. to whom Hans gave a book _.

関係詞句には、2つの依存関係が同時に存在する。一つは、REL属性によりコード化される依存関係であり、また一つは、SLASH属性により コード化される filler-gap の依存関係である。しかし、wh 関係詞句の説明として、これだけでは不十分である。無限の依存関係(UDC) の上部には、さらに前章で議論したような属性 MOD に対する空でない値が存在する。つまり、c については、もう一回り大きな構造として見る必要がある。
 一般的に、関係詞句の構造は、親のN’のINHER/REL値が閉じているために空となるので、ダッシュの数は増えない。また、属性 MOD のために空でない値を記す最も簡単な方法は、関係詞句の主要部として役割を果たす音声的に空の補文化子 (complimentizer(comp)) を設定することである。HPSGは、compと区別するためにそうした要素を関係文化子 (relativizer (rltvzr)) と読んでいる。
 このような主要部一付加語の構造で、関係詞句の MOD 値は、主要部の娘の SYNSEM 値と構造を共有していなければならない。N’主要部の指標は、関係文化子 rltvzr の TO-BIND/REL 値と関係文化子 rltvzr の S 補文の INHER/REL 値と同一になる。こうした現象は、Nonlocal 素性原理を十分に反映している。
 HPSGは、前提の問題に関連して文脈変換という概念を扱っている。 これは、Groenendijk and Stokhof (1979) と Ballmer (1979) によって定義された。Groenendijk and Stokhof (1979) は、文脈を個人間の主張と見なし、 ある表現が文脈中のパラメータにより実現する概念を指して「文脈変換」と呼んでいる。一方、Ballmer (1979) は、Ranta同様、「文脈変換」の論理を直感主義論理へと拡張している。
 論理文法は、モデル理論的意味論の枠組みで指示語を扱ってきた (Montague Dexis) 。しかし、HPSGは、指示語がもつ微妙な文脈依存の関係をモデル理論で議論すること自体に無理があるとして、上述した句の中のすべての娘の C-INDICES 値が親と同一視できるという立場を主張する。しかし、これもまだ指示的な発話が持つ複雑な特徴を処理する上で十分適しているとはいえないとし、発話の各部分(語彙素) がそれ自体の C-INDICES 値を持ち、こうした値間に存在する共通性が単に発話の性質によるものだと説明している。簡単にいえば、C- INDICES 値に含まれる重要な情報は、発話内で特定されると考えられている。

花村嘉英(2005)「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」より
ファン
検索
<< 2024年09月 >>
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30          
最新記事
写真ギャラリー
最新コメント
タグクラウド
カテゴリーアーカイブ
プロフィール
花村嘉英さんの画像
花村嘉英
花村嘉英(はなむら よしひさ) 1961年生まれ、立教大学大学院文学研究科博士後期課程(ドイツ語学専攻)在学中に渡独。 1989年からドイツ・チュービンゲン大学に留学し、同大大学院新文献学部博士課程でドイツ語学・言語学(意味論)を専攻。帰国後、技術文(ドイツ語、英語)の機械翻訳に従事する。 2009年より中国の大学で日本語を教える傍ら、比較言語学(ドイツ語、英語、中国語、日本語)、文体論、シナジー論、翻訳学の研究を進める。テーマは、データベースを作成するテキスト共生に基づいたマクロの文学分析である。 著書に「計算文学入門−Thomas Mannのイロニーはファジィ推論といえるのか?」(新風舎:出版証明書付)、「从认知语言学的角度浅析鲁迅作品−魯迅をシナジーで読む」(華東理工大学出版社)、「日本語教育のためのプログラム−中国語話者向けの教授法から森鴎外のデータベースまで(日语教育计划书−面向中国人的日语教学法与森鸥外小说的数据库应用)」南京東南大学出版社、「从认知语言学的角度浅析纳丁・戈迪默-ナディン・ゴーディマと意欲」華東理工大学出版社、「計算文学入門(改訂版)−シナジーのメタファーの原点を探る」(V2ソリューション)、「小説をシナジーで読む 魯迅から莫言へーシナジーのメタファーのために」(V2ソリューション)がある。 論文には「論理文法の基礎−主要部駆動句構造文法のドイツ語への適用」、「人文科学から見た技術文の翻訳技法」、「サピアの『言語』と魯迅の『阿Q正伝』−魯迅とカオス」などがある。 学術関連表彰 栄誉証書 文献学 南京農業大学(2017年)、大連外国語大学(2017年)
プロフィール
×

この広告は30日以上新しい記事の更新がないブログに表示されております。