基本的な文字化の原則について

基本的な文字化の原則(Basic Transcription System for Japanese: BTSJ)の開発の背景

宇佐美まゆみ（1997）「基本的な文字化の原則（Basic Transcription System for Japanese: BTSJ）の開発について」『日本人の談話行動のスクリプト・ストラテジーの研究とマルチメディア教材の試作』平成7年度～平成8年度文部省科学研究費-基盤研究(C)(2)-　研究成果報告書（課題番号07680312）研究代表者西郡仁朗、12-26頁より、1節から3節を抜粋

近年、日本語教育の分野においても、自然会話を対象とする会話分析が盛んに行われるようになってきた。そこで、まず直面するのが、いかに「文字化」をするのかという問題である。日本語の、特に大人の自然会話を少しでも文字化したことのある人なら、誰でもその困難さを実感していることだろう。その原因となっている最大の特徴として以下の3点が挙げられる。

(1) 話者の発話に重なる小声のあいづち（はーはーはー等）が非常に多い。(2) (1)も含めて、話者交代の際など、オーバーラップする発話が非常に多い。(3)話し言葉の特徴として、「～て、～て、～だし、～ので、～たら、～て、結局～したんです。」のように、文法的文としてなかなか切れない、長い発話（文）が続くことがままある。しかもその文の途中に、(1)(2)で述べたような、小声のあいづちが入ったり、話者が一息入れたところへ、「あー、そうですか。」と相手のあいづちが入ったりすることが多いため、どこでラインを変えるか、どうやって実質的な「ターン」をわかりやすく表すか等々、様々な問題が生じてくるのである。そのため、とりあえず、分析のスタートラインに立つために、録音テープなしで、文字として会話を全体的に把握できるような、「基本的な」文字化資料を作成しようとしただけでも、すぐにその文字化の困難さに直面することになるわけである。もちろん、文字化の仕方というのは、基本的に研究の対象や目的に最適な方法を取るべきで、すべての研究に万能な「文字化」の方法などありえない。例えば、「あいづちの音声的特徴による効果」を研究したいなら、あいづちの部分の詳細な音声的記述が必要になるだろうし、「沈黙」の長さにかかわる研究なら、その秒数を10分の1秒単位で細かく記録する等、研究目的に応じて、会話のある部分を取り出し、そこに特別な注意を払い、その必要な部分のみを入念に記述するということが必要になってくるのは言うまでもない。しかし、「会話」というのは、それらの部分的な要素や効果を内包する「全体」であり、その単なる部分の総和ではない有機的な全体をまず捉えるということも必要になってくる。そのためには、まず会話全体の流れを文字で捉えるという段階は必ず通らなければならない。録音した会話テープを前に、とりあえず、それらを文字化し、そこから得られる直観や洞察を基に、何らかの仮説を立てた上で、具体的な研究項目を絞っていくという手順を踏むことも多々あるわけである。しかし、そうした手順を踏もうとした時にすぐに直面するのが、冒頭にも述べた「基本的」な文字化の仕方の問題である。たとえ「基本的」なものであっても、生きた会話を「忠実に」文字化するということは、至難の技であるということに改めて気づくのである。

本稿は、このような問題意識に基づいて、研究者間で共有できる「基本的な文字化資料の作成」を念頭におきながら、過去五年間修正を繰り返しながらまとめた、スタートラインとしての「文字化の原則」の一案を提示するものである（本バージョンの前段階のものは、宇佐美（1996）にまとめた）。この「文字化の原則」は、目的に応じた加工をしながら使うことを前提とした、あくまで「基本的な文字化の原則」である。故に、実際に適用する際には、研究目的に応じて、必要な部分をより詳しい記述法にするなどの、部分的処理を施すことが必要である。また、あくまで、これは、一つのたたき台であり、今後さらなる修正を重ねていく必要があることは言うまでもない。

Ochs (1979:p44)が言うように、「文字化というのは、理論的な目的や定義を反映する選択のプロセスである。（筆者訳）」ここに一案を提示するのは、「文字化のプロセス」について公の場で吟味していくきっかけを作ることは、研究の単なる手段の検討ではなく、自然会話分析の方法論の本質的な検討・考察へとつながるものであり、ひいては、自然会話研究自体の目的や課題をより明確にしていくことにも通ずると考えるからである。本案は、その第一歩に過ぎないことを断っておく。

2-1.主にアメリカにおける文字化の原則にかかわる研究

自然会話の分析に対するアプローチは、大きく分けると、（１）エスノメソドロジストらを中心に行われている会話分析（Conversation Analysis）、（２）その影響を受け発展した言語学者を中心とするもの（談話分析と呼ばれることが多い）、（３）発達心理学者、社会心理学者らによるもの（第一言語習得研究・社会的相互作用研究の一環として行われることが多い）、の三つに分けられよう。これら三つの領域の関心は、今や重なる部分も増えてきており、今後は、各領域の枠にこだわらない相互交流を通して、真の融合的（trans-disciplinary）な研究がなされるべきである。しかし、ここでは、便宜上、上記三種のこれまでのアプローチの特徴とその記述法（文字化の原則）の特徴を、簡単にまとめておく。

（１）のエスノメソドロジストたちは、あくまで会話分析を通して、ある社会における成員の行動パターンやその社会的秩序を発見し、分析するという、社会学的興味に基づいている（サーサス他、1989）。成員間の相互作用としての会話の入念な記述と分析を通して、成員が何かを成し遂げる方法を発見しようとするものである。従って、記述法は詳細であり、文字化の原則はほぼ確立していると言ってもいいだろう。しかし、そもそも、エスノメソドロジーは、量的処理によって客観性を得るという方法を取らないので、大量のデータを扱うことや、或いは、コンピュータ処理のしやすさを重視していない文字化の原則であると言えよう。

（２）の言語学者による談話・会話研究は、エスノメソドロジーの知見に触発されて発展してきたが、興味の中心はあくまで「言語」としての談話の構成、機能、或いは、談話における談話標識（discourse marker）の機能などにあるように見える。しかし、それらの分析結果から談話に関する何らかの一般法則や傾向を得たいという目的があるため、言語資料を共有財産として蓄積することには積極的である。そのため、トランスクリプトのデータベース化を念頭においた文字化の原則の開発や議論は盛んで、ここ十数年の間にいくつかの研究機関、グループなどが、「基本的な文字化の原則」を開発している。さらに、それら数種類の文字化の原則を互いに示し合い、その研究目的との関係、長所・短所等を考察するという論文集が既に出版されている（Edwards & Lampert、1993）。

（３）の心理学者たちの動向が、日本では最も知られていないが、心理学の主要な興味は、言語行動も含めた人間の行動の一般法則の解明にある。心理学が今世紀半ばまで、徹底的な実証科学を目指してきた経緯から、言語行動や自然会話分析に対するアプローチも、量的処理をほぼ前提とすることが多い。心理学全体の中では、社会的相互作用としての会話を対象とする研究者は相対的に少ないが、主に、母（父）と子の対話の分析を中心とする第一言語習得研究のために、文字化の原則の検討、開発、データベース化が進んだ。

例えば、CHILDES system（MacWhinney,1991;MacWhinney & Snow,1990）では、スペイン語等の英語以外の言語のデータの蓄積も進んでおり、一般の研究者のCHILDESへのデータの提供や使用も既に柔軟に行われている。日本語版も開発されているが、ローマ字表記にしなければならない点が、特に、日本語会話の分析を重視した際に最大の難点となる。また、全体的な問題として、このシステムは幼児の第一言語習得研究に適したように開発されているため、ほぼ自動的に形態素の数や、タイプ・トークンの比率（Type-Token Ratio）を算出する等、種々の便利な機能を備えているが、大人の会話を分析する際には、あまり必要のないものが多い。また、特に日本語の大人の会話の特徴である、長い発話（文）の処理の仕方の工夫がなされていない等の問題点があり、大人の会話の分析に適しているとはいい難いという難点がある。

2-2.日本における文字化の原則にかかわる研究

日本においては、実際の会話の資料は、主に方言研究の文脈の中で発展し、蓄積されてきたと言ってもよいだろう。最近、方言研究のみならず、話し言葉の分析への関心の高まりとともに、文字化の方法についての疑問や困難を訴える声も高まってきた。その要望に答えるかのごとく、シンポジウムで「データの観察と記述法」が取り上げられたり（第１回社会言語学研究会、1994年7月）、雑誌で「文字化資料と録音録画資料」の特集が組まれたりするようになってきた（日本語学、1996年4月号）。いずれも、タイムリーで有意義な試みであった。ただ、これらのほとんどは、領域や研究目的が異なる研究者、グループが、各々の目的に応じた「文字化の方法」を提示したり、それぞれの研究目的の遂行のために文字化資料の果たす役割やその作成上の問題点などを考察するもので、その意味では有益であった。しかし、より一般的な目的“general research purposes”（Ochs, 1979）のための汎用性を持つ「基本的な文字化の原則」の作成への試みや、コーディング作業も含めた、コンピュータ処理に適合するという視点を重視した上で、文字化の原則自体の問題に踏み込んだものは少なかった。

また、上記シンポジウムでは、５つの発表のうち、３つまでが、海外で、主に英語の会話資料を中心として開発された「基本的文字化の原則」に多少の変更を加えて、日本語に当てはめたものであった。今後のこの領域の研究の発展の方向性を考えると、他言語との比較対照研究は必須である。その意味で、主に英語用にではあるが、既にかなり議論や試行錯誤が重ねられた上で、ほぼ確立されている「文字化の原則」に準ずることによって、他言語との比較対照研究を容易にするということは、妥当な方法ではある。しかしながら、日本語の場合、慣れ親しんでいる通常の表記法があまりにもアルファベット表記とかけ離れているため、後述の「読みやすさ（readability）」という観点から考えると、アルファベット表記を前提に考案された記述法を、そのまま借用するのは最上とは言い難い。それのみならず、既に会話の記述の単位としての「発話単位」が日本語と米語で異なることなどが報告されており（メイナード、1993；Iwasaki, 1993）、この点を考えても、英語の分析を中心に開発された原則の借用については、表記を漢字仮名混じりに変えるという部分的変更を施したものも含めて、それらが本当に日本語の会話の文字化に適切かどうかということにはかなり疑問が残る。

これまでの日本におけるデータの記述法についての研究動向は、上記のように、文字化にまつわる種々の問題を改めて提示する段階にとどまっており、日本語の分析に最も適したものという観点からの「基本的文字化の原則」作成への試みや、その問題点が本格的に議論されたことはなかったと言えるだろう。

BTSJは、主に、以下の点に注意して考案された。

研究の視点を得るために、読みやすいものであること。
定量的分析に適するものであること。
よって、データベース化がしやすく、記号等によって検索がしやすいものであること。
コーディングが「発話文」単位でできること。（発話文の定義は後出）
対人機能に重要な役割を果たすと考えられる周辺言語情報は、ト書き的にして、なるべく多くをし記しておくこと。

以下に、もう少し詳しく述べる。

3-1. ローカルな要素（ラインの区切り方、表記法など）

以上の内外の「文字化」にかかわる研究の概観を見ても分かるように、日本の研究における文字化の原則は、かなり個別の研究目的に応じたものが多く、一般的な研究目的に適合する汎用性が考慮されたものはほとんどない。また、海外で開発された文字化の原則に準じる形のものは、他言語との比較対照を容易にするという世界的な研究の場における汎用性という点を考えると非常に魅力的ではある。しかし、表記法や発話の単位など様々な点で、英語とは異なる特徴を持つ日本語の分析を第一の目的としたときには、様々な問題が残る。例えば、ほぼ普遍的であるとして、Chafe（1987）によって提唱されたイントネーション・ユニットは日本語にはうまく適用できない（Iwasaki、1993）という報告などが既になされている。

時には何千枚にも及ぶ文字化資料が含む有益な諸情報を、研究者が効率的に抽出しやすくするためには、その「読みやすさ（readability）」が非常に重要であることは、多くの研究者が指摘している（Edwards & Lampert、1993；日本語学、1996）。そのため、筆者自身が実際に膨大な量の文字化資料と取り組んできた経験も考慮した上で、本稿で提示する「文字化の原則」の表記は、「読みやすさ」を重視し、通常の慣習的表記に近い「漢字かな混じり」とする。また、ライン変えについては、長い文や頻繁に入るあいづちの表記などを考慮し、独自に原則を設けた（詳細後述）。

国際的な汎用性を考えると、漢字かな混じり表記は不適当であるという点は最後まで、勘案事項であった。しかし、現状では、そもそも異なる言語における会話やその分析を通して見いだされる社会的相互作用のパターンを異なる言語間で比較しようとする際に、研究の手段としての文字化の原則を短絡的に同一にすることが、そのままそこから導かれる比較の結果の客観性を保証するとは限らないのではないかと考えている。すなわち、一言語（英語）に適切なものとして発展してきた文字化の方法を、そのまま他の言語（日本語）に適用することは、その過程の中で、既に、本来の目的である日本語の会話の様々な特徴を、かえって見い出しにくくしてしまう危険性も含んでいるという意味で、ともすれば、本末転倒になる恐れもあるのではないかということである。

現状では、各々の言語、或いは、言語グループに最も適した文字化の原則を用いて、各々の言語における会話の特徴やそれに関する知見を見い出すことのほうが重要なのではないかと考えている。むしろ、そこから導き出されるいくつかの言語における会話行動に関する知見の蓄積、比較・検討を通して、逆に、より多くの言語の分析に適用しうる「普遍的な」文字化の原則のあり方が見えてくるということもあるかもしれない。日本語の会話分析に適した「文字化の原則」を日本語研究者で開発し、そのプロセスで得られた知見を世界に提示していくことで、英語などの印・欧言語だけでなく、日本語などの言語の分析も含む、より普遍的な会話の「記述法」を考えるきっかけを与える、という形で世界に貢献するということも可能なのではないかと考えている。ただ、この問題は、非常に複雑な要素を含んでおり、今後の大きな検討課題として残したい。

現状では、本稿で提示するような「基本的な文字化の原則」を適用して得られた研究結果を、国際的な雑誌に発表する際などは、その旨明記した上で、会話の「抜粋」部分を「ローマ字表記」にするということが考えられよう。

本稿で提示する「基本的な文字化の原則」は、あくまで研究者自身が分析する際に、より効率的になんらかの直観や研究の題材が得られるものであるということを最優先して考案されたものであること、すなわち、そのための「読みやすさ（readability）」を重視したものであるということを再度、記しておく。

3-2. グローバルな要素（自然会話分析に対するアプローチが規定するもの）

もう一点、「基本的な文字化の原則」作成に影響してくるのが、自然会話分析にいかにアプローチするかという、よりグローバルな観点からの方法論である。2-1.で概観したように、エスノメソドロジストによる会話分析は、その研究目的に応じた形で、質的分析を重視する独自の方法論を展開しており、文字化の原則についても、主に英語の分析を中心に開発され、既にある程度確立されている。これは、ひとつの有効なアプローチであると考える。しかし、本稿で筆者が依拠している「自然会話分析法」とは、異なるアプローチであるのでここでは論じない。

以下に、筆者が依拠する「自然会話分析」への言語社会心理学的アプローチの概要を、言語学の流れにおける会話分析の方法論と簡単に比較しながら記す（より詳しくは、宇佐美（1997b）を参照のこと）。というのは、本稿で提示する「基本的な文字化の原則」は、以下3-3.に述べる言語社会心理学的アプローチによる自然会話分析にもっとも適するものとして考案されたものだからである。

3-2-1.自然会話分析への言語社会心理学的アプローチ

2-1.で概観した２）の言語学者を中心とするアプローチと、３）心理学者を中心とするアプローチは、先述したように、それぞれ興味の中心は異なるが、データの蓄積と共有、コンピュータ処理を念頭においているという点は共通している。言語学者は、コンピュータ処理がしやすいという時、データベースの中から例えば、"going to" "gonna"等が同じ意味を持つものとして、容易に検索、抽出できるというようなことを重視しているようである（Gumpers & Berenz、1993）。一方、心理学者のアプローチは、目的に応じて語彙の使用分布等、言語的な要素も扱うが、主に、研究目的に応じて、様々な相互作用における各発話の機能などを分類し、コーディングを行い、その頻度等を従属変数として、実験者が設定した独立変数との相関や因果関係を、統計処理によって検討するというものが多い。

例えば、独立変数を性別にするなら、まずデータ収集の際に既に女性の会話と男性の会話を年齢、その他の条件をなるべく同一にして同数収集しておく。その上で、従属変数として「割り込み」を扱うなら、各発話ごとに別枠を設けて、割り込みのタイプの分類をコーディングしていき、性別とタイプ別割り込みの頻度が有意に関係しているか否かを見るというようなアプローチである。質的分析とは異なり、ある程度のサンプル数が必要なため、データベース化が必須となるわけである。

自然会話分析へのアプローチも、唯一絶対のものがあるわけではなく、研究目的に応じて、その都度適切なアプローチが選択されるべきである。しかし、本稿は、これまで述べてきたように、主に、日本語のデータの蓄積、共有のための汎用性を考慮した「基本的な文字化の原則」の一案を提示することが目的である。特に汎用性を考えると、３）の言語社会心理学的アプローチに準拠した方法論の枠に基づいて原則を立てると、２）の言語学的アプローチも含むことが可能なため最も汎用性が高くなる。つまり、グローバルな要素としては、エスノメソドロジストのアプローチには適合しないが、言語学者、心理学者のアプローチを包括し得るものとして、コーディングがしやすいこと、単語のみならず、オーバーラップの箇所と方向が検索しやすいこと等々、コンピュータによる量的処理が行いやすいということを優先的に考慮して、考案した。尚、最近は、エスノメソドロジストの中にも、質的分析と量的分析のバランスを考えるという動きもある（Scott Saft,　personal communication）ことを付け加えておく。

また、言語学における談話分析などに見られる質的分析をする際にも、この「文字化の原則」は、スタートラインの文字化資料として有効である考えている。「読みやすさ」を重視したのは、一つには、質的分析にもそれが重要だと考えたからである。先述のように、より細かい分析のためには、いずれにしても、研究目的に応じてこの記述法に何らかの加工を加える必要があるが、その段階に進むまでの過程を考えても、「読みやすさ」は重要である。そういう意味で、この「文字化の原則」は、コンピュータ処理を行う量的分析にも、質的分析にも、最低限必要なものを満たす「基本的な文字化資料」作成のための原則の一案である。

3-2-2.基本的な文字化の原則が最大限活用される自然会話分析への言語社会心理学的アプローチのまとめ

男女差や年齢差を見るなどの目的に応じて、条件を統制してデータを収集する。
フォローアップ・アンケート（インタビュー）などで、必ず被験者の背景的情報や、会話自体に関する感想などを収集し、なんらかの定量的処理ができるようにする。
分析項目をコーディングして、定量的処理ができるようにする。
コード化の過程で失われたものがないかなどを、必ず、質的な分析で確認・検討する。

以下に、これまでにまとめてきた様々な点を考慮して開発してきた「基本的な文字化の原則（Basic Transcription System for Japanese: BTSJ）」の具体的原則、凡例を示す。

基本的な文字化の原則(Basic Transcription System forJapanese:BTSJ)を用いた研究方法(コーディングの仕方)2011年版

本稿では、「基本的な文字化の原則（BTSJ）」によって文字化した資料を用いて行う研究の分析方法を説明する。BTSJは、その名の通り、「基本的な．．．．文字化の原則」であり、汎用性を念頭において構築された文字化のルールである。基本的には、「基本的な文字化の原則（BTSJ）」で記述した原則に沿って文字化するが、研究の目的に応じて、例えば、より詳細な音声情報を付与するなど、BTSJの原則を基本にしつつも、必要であれば、独自の記号を追加して対応することも可能である。ここでは文末のスピーチレベルと終助詞を例として、個々の研究目的に応じて分析対象をコーディングする際の工夫のし方を提示する。

MENU