日本語

日本語
にほんご
Nihongo.svg
縦書き日本語と書かれた 日本語の表記体系
発音 IPA:
[nʲiho̞ŋːo̞][1]
[nʲiho̞ŋɡo̞][2]
[nʲip̚po̞ŋːo̞](まれ)[3]
[nʲip̚po̞ŋɡo̞](まれ)[2]
話される国 日本の旗 日本
民族 日本人大和民族
話者数 約1億2,500万人[4]
または
約1億2,700万人(琉球諸語方言とみなし、数に含んだ場合で、国勢調査を基にした場合の概数。)
言語系統
日琉語族孤立した言語で論争あり。詳細は 日本語の起源を参照。)
初期形式
標準語
方言 日本語の方言
表記体系 漢字
仮名平仮名片仮名
点字
公的地位
公用語 日本の旗 日本国(事実上)
パラオの旗 パラオ共和国[注 1]
統制機関 日本の旗 文化庁 文化審議会 国語分科会(事実上)
言語コード
ISO 639-1 ja
ISO 639-2 jpn
ISO 639-3 jpn
Glottolog nucl1643 
(八丈方言を除く)
[9]
Linguasphere 45-CAA-a
 
テンプレートを表示

日本語(にほんご、にっぽんご[注 2]: Japanese)は、主に日本国内や日本人同士の間で使用されている言語。日本は法令によって公用語を規定していないが、法令その他の公用文は全て日本語で記述され、各種法令[10]において日本語を用いることが規定され、学校教育においては「国語」の教科として学習を行う等、事実上、日本国内において唯一の公用語となっている。

使用人口について正確な統計はないが、日本国内の人口、及び日本国外に住む日本人や日系人、日本がかつて統治した地域の一部住民など、約1億3千万人以上と考えられている[11]。統計によって前後する場合もあるが、この数は世界の母語話者数で上位10位以内に入る人数である。

日本で生まれ育ったほとんどの人は、日本語を母語とする[注 3]。日本語の文法体系や音韻体系を反映する手話として日本語対応手話がある。

2019年4月現在、インターネット上の言語使用者数は、英語中国語スペイン語アラビア語ポルトガル語マレー語/インドネシア語フランス語に次いで8番目に多い[12][信頼性要検証]

日本語の音韻は、「」「」を除いて母音で終わる開音節言語の性格が強く、また標準語共通語)を含め多くの方言モーラを持つ。アクセント高低アクセントである。

なお元来の古い大和言葉では、原則として

  • ら行」音が語頭に立たない(しりとり遊びで『ら行』で始まる言葉が見つけにくいのはこのため。『らく(楽)』『らっぱ』『りんご』『れい(礼)』などは大和言葉でない)
  • 濁音が語頭に立たない(『だ(抱)く』『どれ』『ば(場)』『ばら(薔薇)』などは後世の変化)
  • 同一語根内に母音が連続しない(『あ お(青)』『かい(貝)』は古くは『あを /awo/』, 『かひ /kapi/』)

などの特徴があった(「系統」および「音韻」の節参照)。

文は、「主語修飾語述語」の語順で構成される。修飾語は被修飾語の前に位置する。また、名詞の格を示すためには、語順や語尾を変化させるのでなく、文法的な機能を示す機能語(助詞)を後ろに付け加える(膠着させる)。これらのことから、言語類型論上は、語順の点ではSOV型の言語に、形態の点では膠着語に分類される(「文法」の節参照)。

語彙は、古来の大和言葉(和語)のほか、漢語(字音語)、外来語、および、それらの混ざった混種語に分けられる。字音語(漢字の音読みに由来する語の意、一般に「漢語」と称する)は、漢文を通して古代・中世の中国から渡来した語またはそれらから派生した語彙であり、現代の語彙の過半数を占めている。また、「(かみ)」「/(ゑ)」など、もともと音であるが和語と認識されているものもある。さらに近代以降には西洋由来の語を中心とする外来語が増大している(「語種」の節参照)。

待遇表現の面では、文法的・語彙的に発達した敬語体系があり、叙述される人物どうしの微妙な関係を表現する(「待遇表現」の節参照)。

日本語は地方ごとに多様な方言があり、とりわけ琉球諸島[要曖昧さ回避]で方言差が著しい(「方言」の節参照)。近世中期までは京都方言が中央語の地位にあったが、近世後期には江戸方言が地位を高め、明治以降の現代日本語では東京山の手中流階級以上の方言(山の手言葉)を基盤に標準語(共通語)が形成された(「標準語」参照)。

表記体系はほかの諸言語と比べて複雑である。漢字国字を含む。音読みおよび訓読みで用いられる)と平仮名片仮名が日本語の主要な文字であり、常にこの3種類の文字を組み合わせて表記する(「字種」の節参照)[注 4]。ほかに、ラテン文字ローマ字)やギリシャ文字(医学・科学用語に多用)などもしばしば用いられる。また、縦書きと横書きがいずれも用いられる(表記体系の詳細については「日本語の表記体系」参照)。

音韻は「子音+母音」音節を基本とし、母音は5種類しかないなど、分かりやすい構造を持つ一方、直音拗音の対立、「1音節2モーラ」の存在、無声化母音、語の組み立てに伴って移動する高さアクセントなどの特徴がある(「音韻」の節参照)。

日本語は、主に日本国内で使用される。話者人口についての調査は国内・国外を問わずいまだないが、日本の人口に基づいて考えられることが一般的である[14]

日本国内に、法令上、日本語を公用語ないし国語と定める直接の規定はない。しかし、法令は日本語で記されており、裁判所法においては「裁判所では、日本語を用いる」(同法74条)とされ、文字・活字文化振興法においては「国語」と「日本語」が同一視されており(同法3条、9条)、その他多くの法令において、日本語が唯一の公用語ないし国語であることが当然の前提とされている。また、法文だけでなく公用文はすべて日本語のみが用いられ、学校教育では日本語が「国語」として教えられている。

日本では、テレビやラジオ、映画などの放送、小説や漫画、新聞などの出版の分野でも、日本語が使われることがほとんどである。国外のドラマや映画が放送される場合でも、基本的には日本語に訳し、字幕を付けたり声を当てたりしてから放送されるなど、受け手が日本語のみを理解することを当然の前提として作成される。原語のまま放送・出版されるものも存在するが、それらは外国向けに発表される前提の論文、もしくは日本在住の外国人、あるいは原語の学習者など限られた人を対象としており、大多数の日本人に向けたものではない。

日本国外では、主として、中南米(ペルーブラジルボリビアドミニカ共和国パラグアイなど)やハワイなどの日本人移民の間に日本語の使用がみられる[15]が、3世・4世と世代が下るにしたがって非日本語話者が多くなっているのが実情である[16]。また、太平洋戦争の終結以前に日本領ないし日本の勢力下にあった朝鮮総督府朝鮮半島台湾総督府台湾・旧満州国で現在中華人民共和国の一部・樺太庁樺太サハリン)・旧南洋庁南洋諸島(現在の北マリアナ諸島パラオマーシャル諸島ミクロネシア連邦)などの地域では、日本語教育を受けた人々の中に、現在でも日本語を記憶して話す人がいる[注 5]。台湾では先住民の異なる部族同士の会話に日本語が用いられることがある[18]だけでなく、宜蘭クレオールなど日本語とタイヤル語クレオール言語も存在している[19]。また、パラオのアンガウル州では歴史的経緯から日本語を公用語の一つとして採用している[20]が、現在州内には日本語を日常会話に用いる住民は存在せず、象徴的なものに留まっている[21]

日本国外の日本語学習者は2015年調査で365万人にのぼり、中華人民共和国の約95万人、インドネシアの約75万人、大韓民国の約56万人、オーストラリアの約36万人、台湾の約22万人が上位となっている。地域別では、東アジア東南アジアで全体の学習者の約8割を占めている。日本語教育が行われている地域は、137か国・地域に及んでいる[22]。また、日本国内の日本語学習者は、アジア地域の約16万人を中心として約19万人に上っている[23]

「日本語」の範囲を本土方言のみとした場合、琉球語が日本語と同系統の言語になり両者は日琉語族を形成する。いっぽう琉球語(琉球方言)も含めて日本語とする場合は、日本語は孤立した言語となる。

日本語(族)の系統は明らかでなく、解明される目途も立っていない。言語学・音韻論などの総合的な結論は『孤立した言語』である。いくつかの理論仮説があるが、いまだ総意を得るに至っていない[24][25]

アルタイ諸語に属するとする説は、明治時代末から特に注目されてきた[26]。その根拠として、古代の日本語(大和言葉)において語頭にr音(流音)が立たないこと、一種の母音調和[27]が見られることなどが挙げられる。ただし、アルタイ諸語に属するとされるそれぞれの言語自体、互いの親族関係が証明されているわけではなく[28]、したがって、古代日本語に上記の特徴が見られることは、日本語が類型として「アルタイ型」の言語である[29]という以上の意味をもたない。

南方系のオーストロネシア語族とは、音韻体系や語彙に関する類似も指摘されている[30]が、語例は十分ではなく、推定・不確定の例を多く含む。

ドラヴィダ語族との関係を主張する説もあるが、これを認める研究者は少ない。大野晋は日本語が語彙・文法などの点でタミル語と共通点を持つとの説を唱える[31]が、比較言語学の方法上の問題から批判が多い[32](「大野晋#クレオールタミル語説」も参照)。

アイヌ語は、語順(SOV語順)において日本語と似るものの、文法・形態は類型論的に異なる抱合語に属し、音韻構造も有声・無声の区別がなく閉音節が多いなどの相違がある。基礎語彙の類似に関する指摘[33]もあるが、例は不充分である[33]。一般に似ているとされる語の中には、日本語からアイヌ語への借用語が多く含まれるとみられる[34]。目下のところは系統的関連性を示す材料は乏しい。

朝鮮語は、文法構造に類似点が非常に多いものの、基礎語彙がかなり相違する。音韻の面では、固有語において語頭に流音が立たないこと、一種の母音調和が見られることなど、上述のアルタイ諸語と共通の類似点がある一方で、閉音節や子音連結が存在する、有声・無声の区別が無いなど相違もある。朝鮮半島死語である高句麗語とは、数詞など似る語彙もあるといわれる[35]が、高句麗語の実態はほとんど分かっておらず、現時点では系統論上の判断材料にはなりがたい。

また、レプチャ語ヘブライ語などとの同系論も過去に存在したが、ほとんど疑似科学の範疇に収まる[33]

琉球列島(旧琉球王国領域)の言葉は、日本語の一方言琉球方言)とする場合と、日本語と系統を同じくする別言語(琉球語ないしは琉球諸語)とし、日本語とまとめて日琉語族とする意見があるが、研究者や機関によって見解が分かれる(各項目参照)。

音韻体系

日本語話者は普通、「いっぽん(一本)」という語を、「い・っ・ぽ・ん」の4単位と捉えている。音節ごとにまとめるならば [ip̚.poɴ] のように2単位となるところであるが、音韻的な捉え方はこれと異なる。音声学上の単位である音節とは区別して、音韻論では「い・っ・ぽ・ん」のような単位のことをモーラ[36](拍[37])と称している。

日本語のモーラは、大体は仮名に即して体系化することができる。「いっぽん」と「まったく」は、音声学上は [ip̚poɴ] [mat̚takɯ] であって共通する単音がないが、日本語話者は「っ」という共通のモーラを見出す。また、「ん」は、音声学上は後続の音によって [ɴ] [m] [n] [ŋ] などと変化するが、日本語の話者自らは同一音と認識しているので、音韻論上は1種類のモーラとなる。

日本語では、ほとんどのモーラが母音で終わっている。それゆえに日本語は開音節言語の性格が強いということができる。もっとも、特殊モーラの「っ」「ん」には母音が含まれない。

モーラの種類は、以下に示すように111程度存在する。ただし、研究者により数え方が少しずつ異なる。「が行」の音は、語中語尾では鼻音(いわゆる鼻濁音)の「か゚行」音となる場合があるが、「が行」と「 か゚行」との違いは何ら弁別の機能を提供せず、単なる異音どうしに過ぎない。そこで、「 か゚行」を除外して数える場合、モーラの数は103程度となる。これ以外に、「外来語の表記」第1表にもある「シェ」「チェ」「ツァ・ツェ・ツォ」「ティ」「ファ・フィ・フェ・フォ」その他の外来音を含める場合は、さらにまた数が変わってくる[38]。このほか、外来語の表記において用いられる「ヴァ・ヴィ・ヴ・ヴェ・ヴォ」については、バ行として発音されることが多いものの、独立した音韻として発音されることもあり、これらを含めるとさらに増えることとなる。

直音 拗音 清濁
母音 ――
子音+母音 きゃ きゅ きょ 清音
しゃ しゅ しょ (清音)
ちゃ ちゅ ちょ (清音)
にゃ にゅ にょ ――
ひゃ ひゅ ひょ (清音)
みゃ みゅ みょ ――
りゃ りゅ りょ ――
ぎゃ ぎゅ ぎょ 濁音
か゚ き゚ く゚ け゚ こ゚ き゚ゃ き゚ゅ き゚ょ 鼻濁音
じゃ じゅ じょ (濁音)
(濁音)
びゃ びゅ びょ (濁音)
ぴゃ ぴゅ ぴょ 半濁音
半子音+母音 ――
――
特殊モーラ 撥音
促音
長音

なお、五十音図は、音韻体系の説明に使われることがしばしばあるが、上記の日本語モーラ表と比べてみると、少なからず異なる部分がある。五十音図の成立は平安時代にさかのぼるものであり、現代語の音韻体系を反映するものではないことに注意が必要である(「日本語研究史」の節の「江戸時代以前」を参照)。

基本5母音の調音位置
左側を向いた人の口の中を模式的に示したもの。左へ行くほど舌が前に出、上へ行くほど口が狭まることを表す。なお、[o] のときは唇の丸めを伴う。

母音は、「」の文字で表される。音韻論上は、日本語の母音はこの文字で表される5個であり、音素記号では以下のように記される。

  • /a/, /i/, /u/, /e/, /o/

一方、音声学上は、基本の5母音は、それぞれ

  • [ä][i̠][u̜]または[ɯ̹][e̞]または[ɛ̝][o̜]または[ɔ̜̝]

に近い発音と捉えられる。̈ は中舌寄り、̠ は後寄り、̜ は弱めの円唇、̹ は強めの円唇、˕ は下寄り、˔ は上寄りを示す補助記号である。

日本語の「あ」は、国際音声記号 (IPA) では前舌母音 [a] と後舌母音 [ɑ] の中間音 [ä] に当たる。「い」は少し後寄りであり [i̠] が近い。「え」は半狭母音 [e] と半広母音 [ɛ] の中間音であり、「お」は半狭母音 [o] と半広母音 [ɔ] の中間音である。

日本語の「う」は、東京方言では、英語などの [u] のような円唇後舌母音より、少し中舌よりで、それに伴い円唇性が弱まり、中舌母音のような張唇でも円唇でもないニュートラルな唇か、それよりほんの僅かに前に突き出した唇で発音される、半後舌微円唇狭母音である[39]。これは舌と唇の動きの連関で、前舌母音は張唇、中舌母音は平唇・ニュートラル(ただしニュートラルは、現行のIPA表記では非円唇として、張唇と同じカテゴリーに入れられている)、後舌母音は円唇となるのが自然であるという法則に適っている[40]。しかし「う」は母音融合などで見られるように、音韻上は未だに円唇後舌狭母音として機能する[41]。また、[ɯᵝ] という表記も行われる[要出典]

円唇性の弱さを強調するために、[ɯ] を使うこともあるが[42]、これは本来朝鮮語に見られる、iのような完全な張唇でありながら、u のように後舌の狭母音を表す記号であり、円唇性が減衰しつつも残存し、かつ後舌よりやや前よりである日本語の母音「う」の音声とは違いを有する。またこの種の母音は、唇と舌の連関から外れるため、母音数5以上の言語でない限り、発生するのは稀である。「う」は唇音の後ではより完全な円唇母音に近づく(発音の詳細はそれぞれの文字の項目を参照)。一方、西日本方言では「う」は東京方言よりも奥舌で、唇も丸めて発音し、[u] に近い。

音韻論上、「コーヒー」「ひいひい」など、「ー」や「あ行」の仮名で表す長音という単位が存在する(音素記号では /R/)。これは、「直前の母音を1モーラ分引く」という方法で発音される独立した特殊モーラである[43]。「鳥」(トリ)と「通り」(トーリ)のように、長音の有無により意味を弁別することも多い。ただし、音声としては「長音」という特定の音があるわけではなく、長母音 [äː] [i̠ː] [u̜̟ː] [e̞ː] [o̜̞ː] の後半部分に相当するものである。

「えい」「おう」と書かれる文字は、発音上は「ええ」「おお」と同じく長母音 [e̞ː] [o̜̞ː] として発音されることが一般的である(「けい」「こう」など、頭子音が付いた場合も同様)。すなわち、「衛星」「応答」「政党」は「エーセー」「オートー」「セートー」のように発音される。ただし、九州や四国南部・西部、紀伊半島南部などでは「えい」を [e̞i] と発音する[44]。「思う」[omoɯᵝ]、「問う」[toɯᵝ]などの単語は必ず二重母音となり、また軟骨魚のエイなど、語彙によって二重母音になる場合もあるが、これには個人差がある。1文字1文字丁寧に発話する場合には「えい」を [e̞i] と発音する話者も多い。

単語末や無声子音の間に挟まれた位置において、「イ」や「ウ」などの狭母音はしばしば無声化する。たとえば、「です」「ます」は [de̞su̜̟̥] [mäsu̜̟̥] のように発音されるし、「菊」「力」「深い」「放つ」「秋」などはそれぞれ [kʲi̠̥ku̜̟] [ʨi̠̥käɾä] [ɸu̜̟̥käi̠] [hänäʦu̜̟̥] [äkʲi̠̥] と発音されることがある。ただしアクセント核がある拍は無声化しにくい。個人差もあり、発話の環境や速さ、丁寧さによっても異なる。また方言差も大きく、たとえば近畿方言ではほとんど母音の無声化が起こらない。

」の前の母音は鼻音化する傾向がある。また、母音の前の「ん」は前後の母音に近似の鼻母音になる。

子音は、音韻論上区別されているものとしては、現在の主流学説によれば「か・さ・た・な・は・ま・や・ら・わ行」の子音、濁音「が・ざ・だ・ば行」の子音、半濁音「ぱ行」の子音である。音素記号では以下のように記される。ワ行とヤ行の語頭子音は、音素 u と音素 i の音節内の位置に応じた変音であるとする解釈もある。特殊モーラの「ん」と「っ」は、音韻上独立の音素であるという説と、「ん」はナ行語頭子音 n の音節内の位置に応じた変音、「っ」は単なる二重子音化であるとして音韻上独立の音素ではないという説の両方がある。

  • /k/, /s/, /t/, /h/(清音)
  • /ɡ/, /z/, /d/, /b/(濁音)
  • /p/(半濁音)
  • /n/, /m/, /r/
  • /j/, /w/(半母音とも呼ばれる)

一方、音声学上は、子音体系はいっそう複雑な様相を呈する。主に用いられる子音を以下に示す(後述する口蓋化音は省略)。

ɕ ʑ 歯茎硬口蓋摩擦音
破擦音
歯茎音 歯茎硬口蓋音
無声音 t͡s t͡ɕ
有声音 d͡z d͡ʑ

基本的に「か行」は [k]、「さ行」は [s][θ] を用いる地方・話者もある[44])、「た行」は [t]、「な行」は [n]、「は行」は [h]、「ま行」は [m]、「や行」は [j]、「だ行」は [d]、「ば行」は [b]、「ぱ行」は [p] を用いる。

「ら行」の子音は、語頭では [ɺ]、「ん」の後のら行は英語の [l] に近い音を用いる話者もある。一方、「あらっ?」というときのように、語中語尾に現れる場合は、舌をはじく [ɾ] もしくは [ɽ] となる。

標準日本語およびそれの母体である首都圏方言(共通語)において、「わ行」の子音は、上で挙げた同言語の「う」と基本的な性質を共有し、もう少し空気の通り道の狭い接近音である。このため、[u] に対応する接近音[w] と、[ɯ] に対応する接近音[ɰ] の中間、もしくは微円唇という点で僅かに [w] に近いと言え、軟口蓋(後舌母音の舌の位置)の少し前よりの部分を主な調音点とし、両唇も僅かに使って調音する二重調音の接近音といえる[45]。このため、五十音図の配列では、ワ行は唇音に入れられている(「日本語」の項目では、特別の必要のない場合は [w] で表現する)。外来音「ウィ」「ウェ」「ウォ」にも同じ音が用いられるが、「ウイ」「ウエ」「ウオ」と2モーラで発音する話者も多い。

「が行」の子音は、語頭では破裂音の [g] を用いるが、語中では鼻音の [ŋ](「が行」鼻音、いわゆる鼻濁音)を用いることが一般的だった。現在では、この [ŋ] を用いる話者は減少しつつあり、代わりに語頭と同じく破裂音を用いるか、摩擦音の [ɣ] を用いる話者が増えている。

「ざ行」の子音は、語頭や「ん」の後では破擦音(破裂音と摩擦音を合わせた [d͡z] などの音)を用いるが、語中では摩擦音[z] など)を用いる場合が多い。いつでも破擦音を用いる話者もあるが、「手術(しゅじゅつ)」などの語では発音が難しいため摩擦音にするケースが多い。なお、「だ行」の「ぢ」「づ」は、一部方言を除いて「ざ行」の「じ」「ず」と同音に帰しており、発音方法は同じである。

母音「い」が後続する子音は、独特の音色を呈する。いくつかの子音では、前舌面を硬口蓋に近づける口蓋化が起こる。たとえば、「か行」の子音は一般に [k] を用いるが、「」だけは [kʲ] を用いるといった具合である。口蓋化した子音の後ろに母音「あ」「う」「お」が来るときは、表記上は「い段」の仮名の後ろに「ゃ」「ゅ」「ょ」の仮名を用いて「きゃ」「きゅ」「きょ」、「みゃ」「みゅ」「みょ」のように記す。後ろに母音「え」が来るときは「ぇ」の仮名を用いて「きぇ」のように記すが、外来語などにしか使われない。

「さ行」「ざ行」「た行」「は行」の「い段」音の子音も独特の音色であるが、これは単なる口蓋化でなく、調音点が硬口蓋に移動した音である。「し」「ち」の子音は [ɕ] [ʨ] を用いる。外来音「スィ」「ティ」の子音は口蓋化した [sʲ] [tʲ] を用いる。「じ」「ぢ」の子音は、語頭および「ん」の後ろでは [d͡ʑ]、語中では [ʑ] を用いる。外来音「ディ」「ズィ」の子音は口蓋化した [dʲ] [d͡ʑʲ] および [zʲ] を用いる。「ひ」の子音は [h] ではなく硬口蓋音 [ç] である。

また、「」の子音は多くは口蓋化した [nʲ] で発音されるが、硬口蓋鼻音 [ɲ] を用いる話者もある。同様に、「」に硬口蓋はじき音を用いる話者や、「ち」に無声硬口蓋破裂音 [c] を用いる話者もある。

そのほか、「は行」では「」の子音のみ無声両唇摩擦音 [ɸ] を用いるが、これは「は行」子音が [p][ɸ][h] と変化してきた名残りである。五十音図では、奈良時代に音韻・音声でp、平安時代に[ɸ]であった名残で、両唇音のカテゴリーに入っている。外来語には [f] を用いる話者もある。これに関して、現代日本語で「っ」の後ろや、漢語で「ん」の後ろにハ行が来たとき、パ行(p)の音が現れ、連濁でもバ行(b)に変わり、有音声門摩擦音[ɦ]ではないことから、現代日本語でも語種を和語や前近代の漢語等の借用語に限れば(ハ行に由来しないパ行は近代以降のもの)、ハ行の音素はhでなくpであり、摩擦音化規則で上に挙げた場合以外はhに変わるのだという解釈もある。現代日本語母語話者の直感には反するが、ハ行の連濁や「っ」「ん」の後ろでのハ行の音の変化をより体系的・合理的に表しうる[46][47]

また、「た行」では「」の子音のみ [t͡s] を用いる。これらの子音に母音「あ」「い」「え」「お」が続くのは主として外来語の場合であり、仮名では「ァ」「ィ」「ェ」「ォ」を添えて「ファ」「ツァ」のように記す(「ツァ」は「おとっつぁん」「ごっつぁん」などでも用いる)。「フィ」「ツィ」は子音に口蓋化が起こる。また「ツィ」は多く「チ」などに言い換えられる。「トゥ」「ドゥ」([tɯ] [dɯ])は、外来語で用いることがある。

促音「っ」(音素記号では /Q/)および撥音「ん」(/N/)と呼ばれる音は、音韻論上の概念であって、前節で述べた長音と併せて特殊モーラと扱う。実際の音声としては、「っ」は [-k̚k-] [-s̚s-] [-ɕ̚ɕ-] [-t̚t-] [-t̚ʦ-] [-t̚ʨ-] [-p̚p-] などの子音連続となる。ただし「あっ」のように、単独で出現することもあり、そのときは声門閉鎖音となる。また、「ん」は、後続の音によって [ɴ] [m] [n] [ŋ] などの子音となる(ただし、母音の前では鼻母音となる)。文末などでは [ɴ] を用いる話者が多い。

アクセント

日本語は、一部の方言を除いて、音(ピッチ)の上下による高低アクセントを持っている。アクセントは語ごとに決まっており、モーラ(拍)単位で高低が定まる。同音語をアクセントによって区別できる場合も少なくない。たとえば東京方言の場合、「雨」「飴」はそれぞれ「ア\メ」(頭高型)、「ア/メ」(平板型)と異なったアクセントで発音される(/を音の上昇、\を音の下降とする)。「が」「に」「を」などの助詞は固有のアクセントがなく、直前に来る名詞によって助詞の高低が決まる。たとえば「箸」「橋」「端」は、単独ではそれぞれ「ハ\シ」「ハ/シ」「ハ/シ」となるが、後ろに「が」「に」「を」などの助詞が付く場合、それぞれ「ハ\シガ」「ハ/シ\ガ」「ハ/シガ」となる。

共通語のアクセントでは、単語の中で音の下がる場所があるか、あるならば何モーラ目の直後に下がるかを弁別する。音が下がるところを下がり目またはアクセントの滝といい、音が下がる直前のモーラをアクセント核[注 6]または下げ核という。たとえば「箸」は第1拍、「橋」は第2拍にアクセント核があり、「端」にはアクセント核がない。アクセント核は1つの単語には1箇所もないか1箇所だけあるかのいずれかであり、一度下がった場合は単語内で再び上がることはない。アクセント核を で表すと、2拍語には ○○(核なし)、○、○ の3種類、3拍語には ○○○、○○、○○、○○ の4種類のアクセントがあり、拍数が増えるにつれてアクセントの型の種類も増える。アクセント核が存在しないものを平板型といい、第1拍にアクセント核があるものを頭高型、最後の拍にあるものを尾高型、第1拍と最後の拍の間にあるものを中高型という。頭高型・中高型・尾高型をまとめて起伏式または有核型と呼び、平板型を平板式または無核型と呼んで区別することもある。

また共通語のアクセントでは、単語や文節のみの形で発音した場合、「し/るしが」「た/ま\ごが」のように1拍目から2拍目にかけて音の上昇がある(頭高型を除く)。しかしこの上昇は単語に固有のものではなく、文中では「あ/かいしるしが」「こ/のたま\ごが」のように、区切らずに発音したひとまとまり(「句」と呼ぶ)の始めに上昇が現れる。この上昇を句音調と言い、句と句の切れ目を分かりやすくする機能を担っている。一方、アクセント核は単語に固定されており、「たまご」の「ま」の後の下がり目はなくなることがない。共通語の音調は、句の2拍目から上昇し(句の最初の単語が頭高型の場合は1拍目から上昇する)、アクセント核まで平らに進み、核の後で下がる。従って、句頭で「低低高高…」や「高高高高…」のような音調は現れない。アクセント辞典などでは、アクセントを「しるしが」「たごが」のように表記する場合があるが、これは1文節を1つの句として発音するときのもので、句音調とアクセント核の両方を同時に表記したものである[48]

文の構造

日本語の文の例 上の文は、橋本進吉の説に基づき主述構造の文として説明したもの。下の文は、主述構造をなすとは説明しがたいもの。三上章はこれを題述構造の文と捉えている。

日本語では「私は本を読む。」という語順で文を作る。英語で「I read a book.」という語順をSVO型(主語・動詞・目的語)と称する説明にならっていえば、日本語の文はSOV型ということになる。もっとも、厳密にいえば、英語の文に動詞が必須であるのに対して、日本語文は動詞で終わることもあれば、形容詞や名詞+助動詞で終わることもある。そこで、日本語文の基本的な構造は、「S(主語)‐V(動詞)」というよりは、「S(主語)‐P(述語)」という「主述構造」と考えるほうが、より適当である。

  1. 私は(が) 社長だ
  2. 私は(が) 行く。
  3. 私は(が) 嬉しい。

上記の文は、いずれも「S‐P」構造、すなわち主述構造をなす同一の文型である。英語などでは、それぞれ「SVC」「SV」「SVC」の文型になるところであるから、それにならって、1を名詞文、2を動詞文、3を形容詞文と分けることもある。しかし、日本語ではこれらの文型に本質的な違いはない。そのため、日本語話者の英語初学者などは、「I am a president.」「I am happy.」と同じ調子で「I am go.」と誤った作文をすることがある[49]

また、日本語文では、主述構造とは別に、「題目‐述部」からなる「題述構造」を採ることがきわめて多い。題目とは、話のテーマ(主題)を明示するものである(三上章は「what we are talking about」と説明する[50])。よく主語と混同されるが、別概念である。主語は多く「が」によって表され、動作や作用の主体を表すものであるが、題目は多く「は」によって表され、その文が「これから何について述べるのか」を明らかにするものである。主語に「は」が付いているように見える文も多いが、それはその文が動作や作用の主体について述べる文、すなわち題目が同時に主語でもある文だからである。そのような文では、題目に「は」が付くことにより結果的に主語に「は」が付く。一方、動作や作用の客体について述べる文、すなわち題目が同時に目的語でもある文では、題目に「は」が付くことにより結果的に目的語に「は」が付く。たとえば、

  • 4. 象は 大きい。
  • 5. 象は おりに入れた。
  • 6. 象は えさをやった。
  • 7. 象は 鼻が長い。

などの文では、「象は」はいずれも題目を示している。4の「象は」は「象が」に言い換えられるもので、事実上は文の主語を兼ねる。しかし、5以下は「象が」には言い換えられない。5は「象を」のことであり、6は「象に」のことである。さらに、7の「象は」は何とも言い換えられないものである(「象の」に言い換えられるともいう[51])。これらの「象は」という題目は、「が」「に」「を」などの特定のを表すものではなく、「私は象について述べる」ということだけをまず明示する役目を持つものである。

これらの文では、題目「象は」に続く部分全体が「述部」である[52]

大野晋は、「が」と「は」はそれぞれ未知と既知を表すと主張した。たとえば

  • 私が佐藤です
  • 私は佐藤です

においては、前者は「佐藤はどの人物かと言えば(それまで未知であった)私が佐藤です」を意味し、後者は「(すでに既知である)私は誰かと言えば(田中ではなく)佐藤です」となる。したがって「何」「どこ」「いつ」などの疑問詞は常に未知を意味するから「何が」「どこが」「いつが」となり、「何は」「どこは」「いつは」とは言えない。

日本語と同様に題述構造の文を持つ言語(主題優勢言語)は、東アジアなどに分布する。たとえば、中国語朝鮮語ベトナム語マレー語タガログ語にもこの構造の文が見られる。

日本語・英語の構文の違い
三上説によれば、日本語の文は、「紹介シ」の部分に「ガ」「ニ」「ヲ」が同等に係る。英語式の文は、「甲(ガ)」という主語だけが述語「紹介シタ」と対立する。

上述の「象は鼻が長い。」のように、「主語‐述語」の代わりに「題目‐述部」と捉えるべき文が非常に多いことを考えると、日本語の文にはそもそも主語は必須でないという見方も成り立つ。三上章は、ここから「主語廃止論」(主語という文法用語をやめる提案)を唱えた。三上によれば、

  • 甲ガ乙ニ丙ヲ紹介シタ。

という文において、「甲ガ」「乙ニ」「丙ヲ」はいずれも「紹介シ」という行為を説明するために必要な要素であり、優劣はない。重要なのは、それらをまとめる述語「紹介シタ」の部分である。「甲ガ」「乙ニ」「丙ヲ」はすべて述語を補足する語(補語)となる。いっぽう、英語などでの文で主語は、述語と人称などの点で呼応しており、特別の存在である[50]

この考え方に従えば、英語式の観点からは「主語が省略されている」としかいいようがない文をうまく説明することができる。たとえば、

  • ハマチの成長したものをブリという。
  • ここでニュースをお伝えします。
  • 日一日と暖かくなってきました。

などは、いわゆる主語のない文である。しかし、日本語の文では述語に中心があり、補語を必要に応じて付け足すと考えれば、上記のいずれも、省略のない完全な文と見なして差し支えない。

今日の文法学説では、主語という用語・概念は、作業仮説として有用な面もあるため、なお一般に用いられている。一般的には格助詞「ガ」を伴う文法項を主語と見なす。ただし、三上の説に対する形で日本語の文に主語が必須であると主張する学説は、生成文法や鈴木重幸らの言語学研究会グループなど、主語に統語上の重要な役割を認める学派を除いて、少数派である。森重敏は、日本語の文においても主述関係が骨子であるとの立場を採るが、この場合の主語・述語も、一般に言われるものとはかなり様相を異にしている[53]。現在一般的に行われている学校教育における文法(学校文法)では、主語・述語を基本とした伝統的な文法用語を用いるのが普通だが、教科書によっては主語を特別扱いしないものもある[注 7]

文の成分

文を主語・述語から成り立つと捉える立場でも、この2要素だけでは文の構造を十分に説明できない。主語・述語には、さらに修飾語などの要素が付け加わって、より複雑な文が形成される。文を成り立たせるこれらの要素を「文の成分」と称する。

学校文法(中学校の国語教科書)では、文の成分として「主語」「述語」「修飾語」(連用修飾語・連体修飾語)「接続語」「独立語」の5つを挙げている。「並立語(並立の関係にある文節/連文節どうし)」や「補助語・被補助語(補助の関係にある文節/連文節どうし)は文の成分(あるいはそれを示す用語)ではなく、文節/連文節どうしの関係を表した概念であって、常に連文節となって上記五つの成分になるという立場に学校文法は立っている。したがって、「並立の関係」「補助の関係」という用語(概念)を教科書では採用しており、「並立語」「補助語」という用語(概念)については載せていない教科書が主流である。なお「連体修飾語」も厳密にいえばそれだけでは成分にはなり得ず、常に被修飾語と連文節を構成して文の成分になる。

学校図書を除く四社の教科書では、単文節でできているものを「主語」のように「-語」と呼び、連文節でできているものを「主部」のように「-部」と呼んでいる。それに対し学校図書だけは、文節/連文節どうしの関係概念を「-語」と呼び、いわゆる成分(文を構成する個々の最大要素)を「-部」と呼んでいる。

以下、学校文法の区分に従いつつ、それぞれの文の成分の種類と役割とについて述べる。

文を成り立たせる基本的な成分である。ことに述語は、文をまとめる重要な役割を果たす。「雨が降る。」「本が多い。」「私は学生だ。」などは、いずれも主語・述語から成り立っている。教科書によっては、述語を文のまとめ役として最も重視する一方、主語については修飾語と併せて説明するものもある(前節「主語廃止論」参照)。

用言に係る修飾語である(用言については「自立語」の節を参照)。「兄が弟に算数を教える。」という文で「弟に」「算数を」など格を表す部分は、述語の動詞「教える」にかかる連用修飾語ということになる。また、「算数をみっちり教える。」「算数を熱心に教える。」という文の「みっちり」「熱心に」なども、「教える」にかかる連用修飾語である。ただし、「弟に」「算数を」などの成分を欠くと、基本的な事実関係が伝わらないのに対し、「みっちり」「熱心に」などの成分は、欠いてもそれほど事実の伝達に支障がない。ここから、前者は文の根幹をなすとして補充成分と称し、後者に限って修飾成分と称する説もある[54]。国語教科書でもこの2者を区別して説明するものがある。

体言に係る修飾語である(体言については「自立語」の節を参照)。「私の本」「動く歩道」「赤い髪飾り」「大きな瞳」の「私の」「動く」「赤い」「大きな」は連体修飾語である。鈴木重幸鈴木康之高橋太郎鈴木泰らは、ものを表す文の成分に特徴を付与し、そのものがどんなものであるかを規定(限定)する文の成分であるとして、連体修飾語を「規定語」(または「連体規定語」)と呼んでいる。

「疲れたので、動けない。」「買いたいが、金がない。」の「疲れたので」「買いたいが」のように、あとの部分との論理関係を示すものである。また、「今日は晴れた。だから、ピクニックに行こう。」「君は若い。なのに、なぜ絶望するのか。」における「だから」「なのに」のように、前の文とその文とをつなぐ成分も接続語である。品詞分類では、常に接続語となる品詞を接続詞とする。

「はい、分かりました。」「姉さん、どこへ行くの。」「新鮮、それが命です。」の「はい」「姉さん」「新鮮」のように、他の部分に係ったり、他の部分を受けたりすることがないものである。係り受けの観点から定義すると、結果的に、独立語には感動・呼びかけ・応答・提示などを表す語が該当することになる。品詞分類では、独立語としてのみ用いられる品詞は感動詞とされる。名詞や形容動詞語幹なども独立語として用いられる。

「ミカンとリンゴを買う。」「琵琶湖の冬は冷たく厳しい。」の「ミカンとリンゴを」や、「冷たく厳しい。」のように並立関係でまとまっている成分である。全体としての働きは、「ミカンとリンゴを」の場合は連用修飾部に相当し、「冷たく厳しい。」は述部に相当する。

現行の学校文法では、英語にあるような「目的語」「補語」などの成分はないとする。英語文法では「I read a book.」の「a book」はSVO文型の一部をなす目的語であり、また「I go to the library.」の「the library」は前置詞とともに付け加えられた修飾語と考えられる。一方、日本語では、

  • 私は本を読む。
  • 私は図書館へ行く。

のように、「本を」「図書館へ」はどちらも「名詞+格助詞」で表現されるのであって、その限りでは区別がない。これらは、文の成分としてはいずれも「連用修飾語」とされる。ここから、学校文法に従えば、「私は本を読む。」は、「主語‐目的語‐動詞」(SOV) 文型というよりは、「主語‐修飾語‐述語」文型であると解釈される。

鈴木重幸鈴木康之らは、「連用修飾語」のうち、「目的語」に当たる語は、述語の表す動きや状態の成立に加わる対象を表す「対象語」であるとし、文の基本成分として認めている。(高橋太郎鈴木泰工藤真由美らは「対象語」と同じ文の成分を、主語・述語が表す事柄の組み立てを明示するために、その成り立ちに参加する物を補うという文中における機能の観点から、「補語」と呼んでいる。)

「明日、学校で運動会がある。」の「明日」「学校で」など、出来事や有様の成り立つ状況を述べるために時や場所、原因や目的(「雨だから」(「体力向上のために」など)を示す文の成分のことを「状況語」とも言う(鈴木重幸『日本語文法・形態論』、高橋太郎他『日本語の文法』他)。学校文法では「連用修飾語」に含んでいるが、(連用)修飾語が、述語の表す内的な属性を表すのに対して、状況語は外的状況を表す「とりまき」ないしは「額縁」の役目を果たしている。状況語は、出来事や有様を表す部分の前に置かれるのが普通であり、主語の前に置かれることもある。なお、「状況語」という用語はロシア語・スペイン語・中国語(中国語では「状語」と言う)などにもあるが、日本語の「状況語」と必ずしも概念が一致しているわけではなく、修飾語を含んだ概念である。

日本語では、修飾語はつねに被修飾語の前に位置する。「ぐんぐん進む」「白い雲」の「ぐんぐん」「白い」はそれぞれ「進む」「雲」の修飾語である。修飾語が長大になっても位置関係は同じで、たとえば、

ゆく秋の大和の国の薬師寺の塔の上なるひとひらの雲
佐佐木信綱

という短歌は、冒頭から「ひとひらの」までが「雲」に係る長い修飾語である。

法律文や翻訳文などでも、長い修飾語を主語・述語の間に挟み、文意を取りにくくしていることがしばしばある。たとえば、日本国憲法前文の一節に、

われらは、いづれの国家も、自国のことのみに専念して他国を無視してはならないのであつて、政治道徳の法則は、普遍的なものであり、この法則に従ふことは、自国の主権を維持し、他国と対等関係に立たうとする各国の責務であると信ずる。

とあるが、主語(題目)の「われら」、述語の「信ずる」の間に「いづれの国家も……であると」という長い修飾語が介在している。この種の文を読み慣れた人でなければ分かりにくい。英訳で "We hold…"(われらは信ずる)と主語・述語が隣り合うのとは対照的である。

もっとも、修飾語が後置される英語でも、修飾関係の分かりにくい文が現れることがある。次のような文は「袋小路文」(en:garden path sentence) と呼ばれる。

The horse raced past the barn fell.(納屋のそばを走らされた馬が倒れた。)

この場合、日本語の文では「馬」に係る連体修飾語「納屋のそばを走らされた」が前に来ているために文構造がわかりやすいが、英語では「The horse」を修飾する「raced past the barn」があとに来ているために、構造が把握しづらくなっている。具体的には、この英文の途中「The horse raced past the barn」までしか読んでいない状況では、文の成分としての動詞(主語は「The horse」)は「raced」であるように感じられるが、「fell」まで行き着くと、文の成分としての動詞は、文法上、これまで唯一の候補だった(1)「raced」に加え、(2)「fell」が出てくることになり、それぞれの候補ごとに(1)「【(習慣的に、または一般法則に従って[注 8])崩れる納屋】のそばを馬が素早く走り抜けた」なのか(2)「納屋のそばを走らされた馬が倒れた」なのかを検討しなければならなくなる。

品詞体系

学校文法の品詞体系
元の図は、 橋本進吉「国語法要説」[55]に掲載。上図および現在の国語教科書では微修正を加えている。

名詞や動詞、形容詞といった「品詞」の概念は、上述した「文の成分」の概念とは分けて考える必要がある。名詞「犬」は、文の成分としては主語にもなれば修飾語にもなり、「犬だ」のように助動詞「だ」を付けて述語にもなる。動詞・形容詞・形容動詞も、修飾語にもなれば述語にもなる。もっとも、副詞は多く連用修飾語として用いられ、また、連体詞は連体修飾語に、接続詞は接続語に、感動詞は独立語にもっぱら用いられるが、必ずしも、特定の品詞が特定の文の成分に1対1で対応しているわけではない。

では、それぞれの品詞の特徴を形作るものは何かということが問題になるが、これについては、さまざまな説明があり、一定しない。俗に、事物を表す単語が名詞、動きを表す単語が動詞、様子を表す単語が形容詞などといわれることがあるが、例外がいくらでも挙がり、定義としては成立しない。

橋本進吉は、品詞を分類するにあたり、単語の表す意味(動きを表すか様子を表すかなど)には踏み込まず、主として形式的特徴によって品詞分類を行っている[55]。橋本の考え方は初学者にも分かりやすいため、学校文法もその考え方に基づいている。

学校文法では、のうち、「太陽」「輝く」「赤い」「ぎらぎら」など、それだけで文節を作り得るものを自立語(詞)とし、「ようだ」「です」「が」「を」など、単独で文節を作り得ず、自立語に付属して用いられるものを付属語(辞)とする。なお、日本語では、自立語の後に接辞や付属語を次々につけ足して文法的な役割などを示すため、言語類型論上は膠着語に分類される。

自立語は、活用のないものと、活用のあるものとに分けられる。

自立語で活用のないもののうち、主語になるものを名詞とする。名詞のうち、代名詞数詞を独立させる考え方もある。一方、主語にならず、単独で連用修飾語になるものを副詞、連体修飾語になるものを連体詞(副体詞)、接続語になるものを接続詞、独立語としてのみ用いられるものを感動詞とする。副詞・連体詞については、それぞれ一品詞とすべきかどうかについて議論があり、さらに細分化する考え方[56]や、他の品詞に吸収させる考え方[57]などがある。

自立語で活用のあるもののうち、命令形のあるものを動詞、命令形がなく終止・連体形が「い」で終わるものを形容詞(日本語教育では「イ形容詞」)、連体形が「な」で終わるものを形容動詞(日本語教育では「ナ形容詞」)とする。形容動詞を一品詞として認めることについては、時枝誠記[58]鈴木重幸など、否定的な見方をする研究者もいる。

なお、「名詞」および「体言」という用語は、しばしば混同される。古来、ことばを分類するにあたり、活用のない語を「体言」(体)、活用のある語を「用言」(用)、そのほか、助詞・助動詞の類を「てにをは」と大ざっぱに称することが多かった。現在の学校文法では、「用言」は活用のある自立語の意味で用いられ(動詞・形容詞・形容動詞を指す)、「体言」は活用のない自立語の中でも名詞(および代名詞・数詞)を指すようになった。つまり、現在では「体言」と「名詞」とは同一物と見ても差し支えはないが、活用しない語という点に着目していう場合は「体言」、文の成分のうち主語になりうるという点に着目していう場合は「名詞」と称する。

付属語も、活用のないものと、活用のあるものとに分けられる。

付属語で活用のないものを助詞と称する。「春来た」「買っくる」「やるしかない」「分かった」などの太字部分はすべて助詞である。助詞は、名詞について述語との関係(格関係)を表す格助詞(「名詞の格」の節参照)、活用する語について後続部分との接続関係を表す接続助詞、種々の語について、程度や限定などの意味を添えつつ後続の用言などを修飾する副助詞、文の終わりに来て疑問や詠嘆・感動・禁止といった気分や意図を表す終助詞に分けられる。鈴木重幸・高橋太郎他・鈴木康之らは助詞を単語とは認めず、付属辞(「くっつき」)として、単語の一部とする。(格助詞・並立助詞・係助詞・副助詞・終助詞の全部および接続助詞のうち「し」「が」「けれども」「から」「ので」「のに」について)または語尾(接続助詞のうち「て(で)」、条件の形の「ば」、並べ立てるときの「たり(だり)」について)。

付属語で活用のあるものを助動詞と称する。「気を引かれる」「私は泣かない」「花が笑っ」「さあ、出かけよう」「今日は来ないそうだ」「もうすぐ春です」などの太字部分はすべて助動詞である。助動詞の最も主要な役割は、動詞(および助動詞)に付属して以下のような情報を加えることである。すなわち、動詞の(特に受け身・使役・可能など。ヴォイス)・極性(肯定・否定の決定。ポラリティ)・時制(テンス)・(アスペクト)・(推量・断定・意志など。ムード)などを示す役割を持つ。山田孝雄は、助動詞を認めず、動詞から分出される語尾(複語尾)と見なしている[59]。また時枝誠記は、「れる(られる)」「せる(させる)」を助動詞とせず、動詞の接尾語としている[58]。鈴木重幸・鈴木康之・高橋太郎らは大部分の助動詞を単語とは認めない。「た(だ)」「う(よう)は、動詞の語尾であるとし、「ない」「よう」「ます」「れる」「られる」「せる」「させる」「たい」「そうだ」「ようだ」は、接尾辞であるとして、単語の一部とする。(「ようだ」「らしい」「そうだ」に関しては、「むすび」または「コピュラ」「繋辞」であるとする。)

名詞の格

名詞および動詞・形容詞・形容動詞は、それが文中でどのような成分を担っているかを特別の形式によって表示する。

名詞の場合、「が」「を」「に」などの格助詞を後置することで動詞との関係(格)を示す。語順によって格を示す言語ではないため、日本語は語順が比較的自由である。すなわち、

  • 桃太郎 きびだんご やりました。
  • 桃太郎 きびだんご やりました。
  • きびだんご 桃太郎 やりました。

などは、強調される語は異なるが、いずれも同一の内容を表す文で、しかも正しい文である。

主な格助詞とその典型的な機能は次の通りである。

助詞 機能 使用例
動作・作用の主体を表す。 例:「空が青い」、「犬がいる」
連体修飾を表す。 「私の本」、「理想の家庭」
動作・作用の対象を表す。 「本を読む」、「人を教える」
動作・作用の到達点を表す。 「駅に着く」、「人に教える」
動作・作用の及ぶ方向を表す。 「駅へ向かう」、「学校へ出かける」
動作・作用をともに行う相手を表す。 「友人と帰る」、「車とぶつかる」
から 動作・作用の起点を表す。 「旅先から戻る」、「6時から始める」
より 動作・作用の起点や、比較の対象を表す。 「旅先より戻る」、「花より美しい」
動作・作用の行われる場所を表す。 「川で洗濯する」、「風呂で寝る」

このように、格助詞は、述語を連用修飾する名詞が述語とどのような関係にあるかを示す(ただし、「の」だけは連体修飾に使われ、名詞同士の関係を示す)。なお、上記はあくまでも典型的な機能であり、主体を表さない「が」(例、「水が飲みたい」)、対象を表さない「を」(例、「日本を発った」)、到達点を表さない「に」(例、受動動作の主体「先生にほめられた」、地位の所在「今上天皇にあらせられる」)、主体を表す「の」(例、「私は彼の急いで走っているのを見た」)など、上記に収まらない機能を担う場合も多い。

格助詞のうち、「が」「を」「に」は、話し言葉においては脱落することが多い。その場合、文脈の助けがなければ、最初に来る部分は「が」格に相当すると見なされる。「くじらをお父さんが食べてしまった。」を「くじら、お父さん食べちゃった。」と助詞を抜かして言った場合は、「くじら」が「が」格相当ととらえられるため、誤解の元になる。「チョコレートを私が食べてしまった。」を「チョコレート、私食べちゃった。」と言った場合は、文脈の助けによって誤解は避けられる。なお、「へ」「と」「から」「より」「で」などの格助詞は、話し言葉においても脱落しない。

題述構造の文(「文の構造」の節参照)では、特定の格助詞が「は」に置き換わる。たとえば、「空が 青い。」という文は、「空」を題目化すると「空は 青い。」となる。題目化の際の「は」の付き方は、以下のようにそれぞれの格助詞によって異なる。

無題の文 題述構造の文
青い。 青い。
読む。 読む。
学校行く。 学校行く。(学校には行く。)
向かう。 へは向かう。
友人帰る。 友人とは帰る。
旅先から戻る。 旅先からは戻る。
洗濯する。 では洗濯する。

格助詞は、下に来る動詞が何であるかに応じて、必要とされる種類と数が変わってくる。たとえば、「走る」という動詞で終わる文に必要なのは「が」格であり、「馬が走る。」とすれば完全な文になる。ところが、「教える」の場合は、「が」格を加えて「兄が教えています。」としただけでは不完全な文である。さらに「で」格を加え、「兄が小学校で教えています(=教壇に立っています)。」とすれば完全になる。つまり、「教える」は、「が・で」格が必要である。

ところが、「兄が部屋で教えています。」という文の場合、「が・で」格があるにもかかわらず、なお完全な文という感じがしない。「兄が部屋で弟に算数を教えています。」のように「が・に・を」格が必要である。むしろ、「で」格はなくとも文は不完全な印象はない。

すなわち、同じ「教える」でも、「教壇に立つ」という意味の「教える」は「が・で」格が必要であり、「説明して分かるようにさせる」という意味の「教える」では「が・に・を」格が必要である。このように、それぞれの文を成り立たせるのに必要な格を「必須格」という。

活用形と種類

名詞が格助詞を伴ってさまざまな格を示すのに対し、用言(動詞・形容詞・形容動詞)および助動詞は、語尾を変化させることによって、文中のどの成分を担っているかを示したり、時制などの情報や文の切れ続きの別などを示したりする。この語尾変化を「活用」といい、活用する語を総称して「活用語」という。

学校文法では、口語の活用語について、6つの活用形を認めている。以下、動詞・形容詞・形容動詞の活用形を例に挙げる(太字部分)。

活用形 動詞 形容詞 形容動詞
未然形 打たない
打と
強かろ 勇敢だろ
連用形 打ちます
打っ
強かっ
強くなる
強うございます
勇敢だっ
勇敢である
勇敢になる
終止形 打つ 強い 勇敢だ
連体形 打つこと 強いこと 勇敢なこと
仮定形 打て 強けれ 勇敢なら
命令形 打て

一般に、終止形は述語に用いられる。「(選手が球を)打つ。」「(この子は)強い。」「(消防士は)勇敢だ。」など。

連用形は、文字通り連用修飾語にも用いられる。「強く(生きる。)」「勇敢に(突入する。)」など。ただし、「選手が球を打ちました。」の「打ち」は連用形であるが、連用修飾語ではなく、この場合は述語の一部である。このように、活用形と文中での役割は、1対1で対応しているわけではない。

仮定形は、文語では已然形と称する。口語の「打てば」は仮定を表すが、文語の「打てば」は「已(すで)に打ったので」の意味を表すからである。また、形容詞・形容動詞は、口語では命令形がないが、文語では「稽古は強かれ。」(風姿花伝)のごとく命令形が存在する。

動詞の活用は種類が分かれている。口語の場合は、五段活用上一段活用下一段活用カ行変格活用(カ変)・サ行変格活用(サ変)の5種類である。

動詞の種類 特徴
五段動詞 未然形活用語尾が「あ段音」で終わるもの 「買う」
上一段動詞 未然形活用語尾が「い段音」で終わるもの 「見る」「借りる」
下一段動詞 未然形活用語尾が「え段音」で終わるもの 「出る」「受ける」
カ変動詞 「来る」および「来る」を語末要素とするもの
サ変動詞 「する」および「する」を語末要素とするもの

分野ごとの語彙量

ある言語の語彙体系を見渡して、特定の分野の語彙が豊富であるとか、別の分野の語彙が貧弱であるとかを決めつけることは、一概にはできない。日本語でも、たとえば「自然を表す語彙が多いというのが定評」[60]といわれるが、これは人々の直感から来る評判という意味以上のものではない。

実際に、旧版『分類語彙表』[61]によって分野ごとの語彙量の多寡を比べた結果によれば、名詞(体の類)のうち「人間活動―精神および行為」に属するものが27.0%、「抽象的関係」が18.3%、「自然物および自然現象」が10.0%などとなっていて、この限りでは「自然」よりも「精神」や「行為」などを表す語彙のほうが多いことになる[62]。ただし、これも、他の言語と比較して多いということではなく、この結果がただちに日本語の語彙の特徴を示すことにはならない。

日本語の人称はあまり固定化していない。現代語・標準語の範疇としては、一人称は「わたくし・わたし・あたし・ぼく・おれ・うち・自分・我々」など、二人称は「あなた・あんた・おまえ・おめえ・てめえ・きみ」などが用いられる。方言・近代語・古語まで含めるとこの限りではなく、文献上では他にも「あたくし・あたい・わし・わい・わて・我が輩・おれ様・おいら・われ・わー・わん・朕・わっし・こちとら・てまえ・小生・それがし・拙者・おら」などの一人称、「おまえさん・てめえ・貴様・おのれ・われ・お宅・なんじ・おぬし・その方・貴君・貴兄・貴下・足下・貴公・貴女・貴殿・貴方(きほう)」などの二人称が見つかる[63]

上の事実は、現代英語の一人称・二人称代名詞がほぼ "I" と "you" のみであり、フランス語の一人称代名詞が "je"、二人称代名詞が "tu" "vous" のみ、またドイツ語の一人称代名詞が"ich"、二人称代名詞が"du" "Sie" "ihr"のみであることと比較すれば、特徴的ということができる。もっとも、日本語においても、本来の人称代名詞は、一人称に「ワ(レ)」「ア(レ)」、二人称に「ナ(レ)」があるのみである(但し『ナ』はもと一人称とも見られ、後述のこととも関係があるか)。今日、一・二人称同様に用いられる語は、その大部分が一般名詞からの転用である[64]。一人称を示す「ぼく」や三人称を示す「彼女」などを、「ぼく、何歳?」「彼女、どこ行くの?」のように二人称に転用することが可能であるのも、日本語の人称語彙が一般名詞的であることの現れである。

なお、敬意表現の観点から、目上に対しては二人称代名詞の使用が避けられる傾向がある。たとえば、「あなたは何時に出かけますか」とは言わず、「何時にいらっしゃいますか」のように言うことが普通である。

親族語彙の体系」の節も参照。

また、音象徴語、いわゆるオノマトペの語彙量も日本語には豊富である(オノマトペの定義は一定しないが、ここでは、擬声語・擬音語のように耳に聞こえるものを写した語と、擬態語のように耳に聞こえない状態・様子などを写した語の総称として用いる)。

擬声語は、人や動物が立てる声を写したものである(例、おぎゃあ・がおう・げらげら・にゃあにゃあ)。擬音語は、物音を写したものである(例、がたがた・がんがん・ばんばん・どんどん)。擬態語は、ものごとの様子や心理の動きなどを表したものである(例、きょろきょろ・すいすい・いらいら・わくわく)。擬態語の中で、心理を表す語を特に擬情語と称することもある。

オノマトペ自体は多くの言語に存在する。たとえば猫の鳴き声は、英語で「mew」、ドイツ語で「miau」、フランス語で 「miaou」、ロシア語で「мяу[65]、中国語で「喵喵[66]、朝鮮語で「야옹야옹[67]などである[68]。しかしながら、その語彙量は言語によって異なる。日本語のオノマトペは欧米語や中国語の3倍から5倍存在するといわれ[69]、とりわけ擬態語が多く使われるとされる[70]

新たなオノマトペが作られることもある。「(心臓が)ばくばく」「がっつり(食べる)」などは、近年に作られた(広まった)オノマトペの例である。

漫画などの媒体では、とりわけ自由にオノマトペが作られる。漫画家の手塚治虫は、漫画を英訳してもらったところ、「ドギューン」「シーン」などの語に翻訳者が「お手あげになってしまった」と記している[71]。また、漫画出版社社長の堀淵清治も、アメリカで日本漫画を売るに当たり、独特の擬音を訳すのにスタッフが悩んだことを述べている[72]

品詞ごとの語彙量

日本語の語彙を品詞ごとにみると、圧倒的に多いものは名詞である。その残りのうちで比較的多いものは動詞である。『新選国語辞典』の収録語の場合、名詞が82.37%、動詞が9.09%、副詞が2.46%、形容動詞が2.02%、形容詞が1.24%となっている[73]

このうち、とりわけ目を引くのは形容詞の少なさである。かつて柳田國男はこの点を指摘して「形容詞饑饉」と称した[74]。英語の場合、『オックスフォード英語辞典』第2版では、半分以上が名詞、約4分の1が形容詞、約7分の1が動詞ということであり[75]、英語との比較の上からは、日本語の形容詞が僅少であることは特徴的といえる。

ただし、これは日本語で物事を形容することが難しいことを意味するものではない。品詞分類上の形容詞、すなわち「赤い」「楽しい」など「〜い」の形式を採る語が少ないということであって、他の形式による形容表現が多く存在する。「真っ赤だ」「きれいだ」など「〜だ」の形式を採る形容動詞(「〜的だ」を含む)、「初歩(の)」「酸性(の)」など「名詞(+の)」の形式、「目立つ(色)」「とがった(針)」「はやっている(店)」など動詞を基にした形式、「つまらない」「にえきらない」など否定助動詞「ない」を伴う形式などが形容表現に用いられる。

もともと少ない形容詞を補う主要な形式は形容動詞である。漢語・外来語の輸入によって、「正確だ」「スマートだ」のような、漢語・外来語+「だ」の形式の形容動詞が増大した。上掲の『新選国語辞典』で名詞扱いになっている漢語・外来語のうちにも、形容動詞の用法を含むものが多数存在する。現代の二字漢語(「世界」「研究」「豊富」など)約2万1千語を調査した結果によれば、全体の63.7%が事物類(名詞に相当)、29.9%が動態類(動詞に相当)、7.3%が様態類(形容動詞に相当)、1.1%が副用類(副詞に相当)であり[76]、二字漢語の7%程度が形容動詞として用いられていることが分かる。

語彙の増加と品詞」の節も参照。

語彙体系

それぞれのは、ばらばらに存在しているのではなく、意味・用法などの点で互いに関連をもったグループを形成している。これを語彙体系と称する[77]。日本語の語彙自体、一つの大きな語彙体系といえるが、その中にはさらに無数の語彙体系が含まれている。

以下、体系をなす語彙の典型的な例として、指示語・色彩語彙・親族語彙を取り上げて論じる。

日本語では、ものを指示するために用いる語彙は、一般に「こそあど」と呼ばれる4系列をなしている。これらの指示語(指示詞)は、主として名詞(「これ・ここ・こなた・こっち」など)であるため、概説書の類では名詞(代名詞)の説明のなかで扱われている場合も多い。しかし、実際には副詞(「こう」など)・連体詞(「この」など)・形容動詞(「こんなだ」など)にまたがるため、ここでは語彙体系の問題として論じる。

「こそあど」の体系は、伝統的には「近称・中称・遠称・不定(ふじょう、ふてい)称」の名で呼ばれた。明治時代に、大槻文彦は以下のような表を示している[78]

近称 中称 遠称 不定称
事物 これ こ それ そ あれ あ
かれ か
いづれ(どれ) なに
地位 ここ そこ あしこ あそこ
かしこ
いづこ(どこ) いづく
方向 こなた そなた あなた
かなた
いづかた(どなた)
こち そち あち いづち(どち)

ここで、「近称」は最も近いもの、「中称」はやや離れたもの、「遠称」は遠いものを指すとされた。ところが、「そこ」などを「やや離れたもの」を指すと考えると、遠くにいる人に向かって「そこで待っていてくれ」と言うような場合を説明しがたい。また、自分の腕のように近くにあるものを指して、人に「そこをさすってください」と言うことも説明しがたいなどの欠点がある。佐久間鼎(かなえ)は、この点を改め、「こ」は「わ(=自分)のなわばり」に属するもの、「そ」は「な(=あなた)のなわばり」に属するもの、「あ」はそれ以外の範囲に属するものを指すとした[79]。すなわち、体系は下記のようにまとめられた。

指示されるもの
対話者の層 所属事物の層
話し手 (話し手自身)
ワタクシ ワタシ
(話し手所属のもの)
コ系
相手 (話しかけの目標)
アナタ オマエ
(相手所属のもの)
ソ系
はたの
人 もの
(第三者)(アノヒト) (はたのもの)
ア系
不定 ドナタ ダレ ド系

このように整理すれば、上述の「そこで待っていてくれ」「そこをさすってください」のような言い方はうまく説明される。相手側に属するものは、遠近を問わず「そ」で表されることになる。この説明方法は、現在の学校教育の国語でも取り入れられている。

とはいえ、すべての場合を佐久間説で割り切れるわけでもない。たとえば、道で「どちらに行かれますか」と問われて、「ちょっとそこまで」と答えたとき、これは「それほど遠くないところまで行く」という意味であるから、大槻文彦のいう「中称」の説明のほうがふさわしい。ものを無くしたとき、「ちょっとそのへんを探してみるよ」と言うときも同様である。

また、目の前にあるものを直接指示する場合(現場指示)と、文章の中で前に出た語句を指示する場合(文脈指示)とでも、事情が変わってくる。「生か死か、それが問題だ」の「それ」は、「中称」(やや離れたもの)とも、「相手所属のもの」とも解釈しがたい。直前の内容を「それ」で示すものである。このように、指示語の意味体系は、詳細に見れば、なお研究の余地が多く残されている。

なお、指示の体系は言語によって異なる。不定称を除いた場合、3系列をなす言語は日本語(こ、そ、あ)や朝鮮語()などがある。一方、英語(thisthat)や中国語()などは2系列をなす。日本人の英語学習者が「これ、それ、あれ」に「thisitthat」を当てはめて考えることがあるが、「it」は文脈指示の代名詞で系列が異なるため、混用することはできない。

日本語で色彩を表す語彙(色彩語彙)は、古来、「アカ」「シロ」「アヲ」「クロ」の4語が基礎となっている[80]。「アカ」は明るい色(明しの語源か)、「シロ」は顕(あき)らかな色(白しの語源か)、「アヲ」は漠然とした色(淡しの語源か)、「クロ」は暗い色(暗しの語源か)を総称した。今日でもこの体系は基本的に変わっていない。葉の色・空の色・顔色などをいずれも「アオ」と表現するのはここに理由がある[81]

文化人類学者のバーリンとケイの研究によれば、種々の言語で最も広範に用いられている基礎的な色彩語彙は「白」と「黒」であり、以下、「赤」「緑」が順次加わるという[82]。日本語の色彩語彙もほぼこの法則に合っているといってよい。

このことは、日本語を話す人々が4色しか識別しないということではない。特別の色を表す場合には、「黄色(語源は「木」かという[83])」「紫色」「茶色」「蘇芳色」「浅葱色」など、植物その他の一般名称を必要に応じて転用する。ただし、これらは基礎的な色彩語彙ではない。

日本語の親族語彙[84][85]は、比較的単純な体系をなしている。英語の基礎語彙で、同じ親から生まれた者を「brother」「sister」の2語のみで区別するのに比べれば、日本語では、男女・長幼によって「アニ」「アネ」「オトウト」「イモウト」の4語を区別し、より詳しい体系であるといえる(古代には、年上のみ「アニ」「アネ」と区別し、年下は「オト」と一括した[84])。しかしながら、たとえば中国語の親族語彙と比較すれば、はるかに単純である。中国語では、父親の父母を「祖父」「祖母」、母親の父母を「外祖父」「外祖母」と呼び分けるが、日本語では「ジジ」「ババ」の区別しかない。中国語では父の兄弟を「」「」、父の姉妹を「」、母の兄弟を「」、母の姉妹を「」などというが、日本語では「オジ」「オバ」のみである。「オジ」「オバ」の子はいずれも「イトコ」の名で呼ばれる。日本語でも、「伯父(はくふ)」「叔父(しゅくふ)」「従兄(じゅうけい)」「従姉(じゅうし)」などの語を文章語として用いることもあるが、これらは中国語からの借用語である。

親族語彙を他人に転用する虚構的用法[86]が多くの言語に存在する。例えば、朝鮮語(「아버님」お父様)・モンゴル語(「aab」父)では尊敬する年配男性に用いる。英語でも議会などの長老やカトリック教会の神父を「father(父)」、寮母を「mother(母)」、男の親友や同一宗派の男性を「brother(兄弟)」、女の親友や修道女や見知らぬ女性を「sister」(姉妹)と呼ぶ。中国語では見知らぬ若い男性・女性に「老兄」(お兄さん)「大姐」(お姉さん)と呼びかける、そして年長者では男性・女性に「大爺」(旦那さん)「大媽」(伯母さん)と呼びかける。日本語にもこの用法があり、赤の他人を「お父さん」「お母さん」と呼ぶことがある。たとえば、店員が中年の男性客に「お父さん、さあ買ってください」のように言う。フランス語・イタリア語・デンマーク語・チェコ語などのヨーロッパの言語で他人である男性をこのように呼ぶことは普通ではなく、日本語で赤の他人を「お父さん」と呼ぶのが失礼になりうるのと同じく、失礼にさえなるという。

一族内で一番若い世代から見た名称で自分や他者を呼ぶことがあるのも各国語に見られる用法である。例えば、父親が自分自身を指して「お父さん」と言ったり(「お父さんがやってあげよう」)、自分の母を子から見た名称で「おばあちゃん」と呼んだりする用法である。この用法は、中国語・朝鮮語・モンゴル語・英語・フランス語・イタリア語・デンマーク語・チェコ語などを含め諸言語にある。

語種

日本語の語彙を出自から分類すれば、大きく、和語漢語外来語、およびそれらが混ざった混種語に分けられる。このように、出自によって分けた言葉の種類を「語種」という。和語は日本古来の大和言葉、漢語は中国渡来の漢字の音を用いた言葉、外来語は中国以外の他言語から取り入れた言葉である。もっとも、和語とされる「ウメ(梅)」「ウマ(馬)」「カミ(紙/簡)」「ヱ(絵/画)」などが元来中国語からの借用語であった可能性があるなど、語種の境界はときに曖昧である(「語彙史」の節参照)。

和語は日本語の語彙の中核部分を占める。「これ」「それ」「きょう」「あす」「わたし」「あなた」「行く」「来る」「良い」「悪い」などのいわゆる基礎語彙はほとんど和語である。また、「て」「に」「を」「は」などの助詞や、助動詞の大部分など、文を組み立てるために必要な付属語も和語である。

一方、抽象的な概念や、社会の発展に伴って新たに発生した概念を表すためには、漢語や外来語が多く用いられる。和語の名称がすでにある事物を漢語や外来語で言い換えることもある。「めし」を「御飯」「ライス」、「やどや」を「旅館」「ホテル」などと称するのはその例である[87]。このような語種の異なる同義語には、微妙な意味・ニュアンスの差異が生まれ、とりわけ和語には易しい、または卑俗な印象、漢語には公的で重々しい印象、外来語には新しい印象が含まれることが多い。

一般に、和語の意味は広く、漢語の意味は狭いといわれる。たとえば、「しづむ(しずめる)」という1語の和語に、「沈」「鎮」「静」など複数の漢語の造語成分が相当する。「しづむ」の含む多様な意味は、「沈む」「鎮む」「静む」などと漢字を用いて書き分けるようになり、その結果、これらの「しづむ」が別々の語と意識されるまでになった。2字以上の漢字が組み合わさった漢語の表す意味はとりわけ分析的である。たとえば、「弱」という造語成分は、「脆」「貧」「軟」「薄」などの成分と結合することにより、「脆弱」「貧弱」「軟弱」「薄弱」のように分析的・説明的な単語を作る[88](「語彙史」の節の「漢語の勢力拡大」および「語彙の増加と品詞」を参照)。

漢語は、「学問」「世界」「博士」などのように、古く中国から入ってきた語彙が大部分を占めるのは無論であるが、日本人が作った漢語(和製漢語)も古来多い。現代語としても、「国立」「改札」「着席」「挙式」「即答」「熱演」など多くの和製漢語が用いられている[89]。漢語は音読みで読まれることから、字音語と呼ばれる場合もある。

外来語は、もとの言語の意味のままで用いられるもの以外に、日本語に入ってから独自の意味変化を遂げるものが少なくない。英語の "claim" は「当然の権利として要求する」の意であるが、日本語の「クレーム」は「文句」の意である。英語の "lunch" は昼食の意であるが、日本の食堂で「ランチ」といえば料理の種類を指す[90]

外来語を組み合わせて、「アイスキャンデー」「サイドミラー」「テーブルスピーチ」のように日本語独自の語が作られることがある。また、当該の語形が外国語にない「パネラー」(パネリストの意)「プレゼンテーター」(プレゼンテーションをする人。プレゼンター)などの語形が作られることもある。これらを総称して「和製洋語」、英語系の語を特に「和製英語」と言う。

単純語と複合語

日本語の語彙は、語構成の面からは単純語と複合語に分けることができる。単純語は、「あたま」「かお」「うえ」「した」「いぬ」「ねこ」のように、それ以上分けられないと意識される語である。複合語は、「あたまかず」「かおなじみ」「うわくちびる」「いぬずき」のように、いくつかの単純語が合わさってできていると意識される語である。なお、熟語と総称される漢語は、本来漢字の字音を複合させたものであるが、「えんぴつ(鉛筆)」「せかい(世界)」など、日本語において単純語と認識される語も多い。「語種」の節で触れた混種語、すなわち、「プロ野球」「草野球」「日本シリーズ」のように複数の語種が合わさった語は、語構成の面からはすべて複合語ということになる。

日本語では、限りなく長い複合語を作ることが可能である。「平成十六年新潟県中越地震非常災害対策本部」「服部四郎先生定年退官記念論文集編集委員会」といった類も、ひとつの長い複合語である。国際協定の関税及び貿易に関する一般協定は、英語では「General Agreement on Tariffs and Trade」(関税と貿易に関する一般協定)であり、ひとつの句であるが、日本の新聞では「関税貿易一般協定」と複合語で表現することがある。これは漢字の結合力によるところが大きく、中国語・朝鮮語などでも同様の長い複合語を作る。なお、ヨーロッパ語を見ると、ロシア語では「человеконенавистничество」(人間嫌い)、ドイツ語では「Naturfarbenphotographie」(天然色写真)などの長い語の例を比較的多く有し[91]、英語でも「antidisestablishmentarianism」(国教廃止条例反対論。英首相グラッドストンの造語という[92])などの語例がまれにある。

接辞は、複合語を作るために威力を発揮する。たとえば、「感」は、「音感」「語感」「距離感」「不安感」など漢字2字・3字からなる複合語のみならず、「透け感」「懐かし感」「しゃきっと感」「きちんと感」など動詞・形容詞・副詞との複合語を作り、さらには「『昔の名前で出ています』感」(=昔の名前で出ているという感じ)のように文であったものに下接して長い複合語を作ることもある。

日本語の複合語は、難しい語でも、表記を見れば意味が分かる場合が多い。たとえば、英語の「apivorous」 は生物学者にしか分からないのに対し、日本語の「蜂食性」は「蜂を食べる性質」であると推測できる[93]。これは表記に漢字を用いる言語の特徴である。

現代の日本語は、漢字平仮名片仮名を用いて、常用漢字現代仮名遣いに基づいて表記されることが一般的である。アラビア数字ローマ字(ラテン文字)なども必要に応じて併用される。

正書法の必要性を説く主張[94]や、その反論[95]がしばしば交わされてきた。

字種

平仮名・片仮名は、2017年9月現在では以下の46字ずつが使われる。

名称 字形
平仮名
片仮名

このうち、「゛」(濁音符)および「゜」(半濁音符)を付けて濁音・半濁音を表す仮名もある(「音韻」の節参照)。拗音は小書きの「ゃ」「ゅ」「ょ」を添えて表し、促音は小書きの「っ」で表す。「つぁ」「ファ」のように、小書きの「ぁ」「ぃ」「ぅ」「ぇ」「ぉ」を添えて表す音もあり、補助符号として長音を表す「ー」がある。歴史的仮名遣いでは上記のほか、表音は同じでも表記の違う、平仮名「」「」および片仮名「ヰ」「ヱ」の字が存在し、その他にも変体仮名がある。

漢字は、日常生活において必要とされる2136字の常用漢字と、子の名づけに用いられる861字の人名用漢字が、法で定められている。実際にはこれら以外にも一般に通用する漢字の数は多いとされ、日本産業規格(JIS)はJIS X 0208(通称JIS漢字)として約6300字を電算処理可能な漢字として挙げている。なお、漢字の本家である中国においても同様の基準は存在し、現代漢語常用字表により、「常用字」として2500字、「次常用字」として1000字が定められている。これに加え、現代漢語通用字表ではさらに3500字が追加されている。

一般的な文章では、上記の漢字・平仮名・片仮名を交えて記すほか、アラビア数字・ローマ字なども必要に応じて併用する。基本的には、漢語には漢字を、和語のうち概念を表す部分(名詞や用言語幹など)には漢字を、形式的要素(助詞・助動詞など)や副詞・接続詞の一部には平仮名を、外来語(漢語以外)には片仮名を用いる場合が多い。公的な文書では特に表記法を規定している場合もあり[96]、民間でもこれに倣うことがある。ただし、厳密な正書法はなく、表記のゆれは広く許容されている。文章の種類や目的によって、

  • さくらのはながさく / サクラの花が咲く / 桜の花が咲く

などの表記がありうる。

多様な文字体系を交えて記す利点として、単語のまとまりが把握しやすく、速読性に優れるなどの点が指摘される。日本語の単純な音節構造に由来する同音異義語が漢字によって区別され、かつ字数も節約されるという利点もある。計算機科学者の村島定行は、日本語では、表意文字と表音文字の二重の文章表現ができるため、記憶したり、想起したりするのに手がかりが多く、言語としての機能が高いと指摘している[97]。一方で中国文学者の高島俊男は、漢字の表意性に過度に依存した日本語の文章は、他の自然言語に類を見ないほどの同音異義語を用いざるを得なくなり、しばしば実用の上で支障を来たすことから、言語として「顚倒している」と評している[98]。歴史上、漢字を廃止して、仮名またはローマ字を国字化しようという主張もあったが、広く実行されることはなかった[99](「国語国字問題」参照)。今日では漢字・平仮名・片仮名の交ぜ書きが標準的表記の地位をえている。

方言と表記

日本語の表記体系は中央語を書き表すために発達したものであり、方言の音韻を表記するためには必ずしも適していない。たとえば、東北地方では「柿」を [kagɨ]、「鍵」を [kãŋɨ] のように発音するが[100]、この両語を通常の仮名では書き分けられない(アクセント辞典などで用いる表記によって近似的に記せば、「カギ」と「 キ゚」のようになる)。もっとも、方言は書き言葉として用いられることが少ないため、実際上に不便を来すことは少ない。

岩手県気仙方言(ケセン語)について、山浦玄嗣により、文法形式を踏まえた正書法が試みられているというような例もある[101]。ただし、これは実用のためのものというよりは、学術的な試みのひとつである。

琉球語(「系統」参照)の表記体系もそれを準用している。たとえば、琉歌「てんさごの花」(てぃんさぐぬ花)は、伝統的な表記法では次のように記す。

てんさごの花や 爪先に染めて 親の寄せごとや 肝に染めれ
[102]

この表記法では、たとえば、「ぐ」「ご」がどちらも [gu] と発音されるように、かな表記と発音が一対一で対応しない場合が多々ある。表音的に記せば、[tiɴʃagunu hanaja ʦimiʣaʧiɲi sumiti, ʔujanu juʃigutuja ʧimuɲi sumiri] のようになるところである[103]

漢字表記の面では、地域文字というべきものが各地に存在する。たとえば、名古屋市の地名「杁中(いりなか)」などに使われる「杁」は、名古屋と関係ある地域の「地域文字」である。また、「垰」は「たお」「たわ」などと読まれる国字で、中国地方ほかで定着しているという[104]

文は、目的や場面などに応じて、さまざまな異なった様式を採る。この様式のことを、書き言葉(文章)では「文体」と称し、話し言葉(談話)では「話体」[105]と称する。

日本語では、とりわけ文末の助動詞・助詞などに文体差が顕著に現れる。このことは、「ですます体」「でございます体」「だ体」「である体」「ありんす言葉」(江戸・新吉原の遊女の言葉)「てよだわ言葉」(明治中期から流行した若い女性の言葉)などの名称に典型的に表れている。それぞれの文体・話体の差は大きいが、日本語話者は、複数の文体・話体を常に切り替えながら使用している。

なお、「文体」の用語は、書かれた文章だけではなく談話についても適用されるため[106]、以下では「文体」に「話体」も含めて述べる。また、文語文・口語文などについては「文体史」の節に譲る。

普通体・丁寧体

日本語の文体は、大きく普通体(常体)および丁寧体(敬体)の2種類に分かれる。日本語話者は日常生活で両文体を適宜使い分ける。日本語学習者は、初めに丁寧体を、次に普通体を順次学習することが一般的である。普通体は相手を意識しないかのような文体であるため独語体と称し、丁寧体は相手を意識する文体であるため対話体と称することもある[107]

普通体と丁寧体の違いは次のように現れる。

普通体 丁寧体
名詞文 もうすぐ春(春である)。 もうすぐ春です
形容動詞文 ここは静か(静かである)。 ここは静かです
形容詞文 野山の花が美しい。 (野山の花が美しいです。)
動詞文 鳥が空を飛ぶ。 鳥が空を飛びます

普通体では、文末に名詞・形容動詞・副詞などが来る場合には、「だ」または「である」を付けた形で結ぶ。前者を特に「だ体」、後者を特に「である体」と呼ぶこともある。

丁寧体では、文末に名詞・形容動詞・副詞などが来る場合には、助動詞「です」を付けた形で結ぶ。動詞が来る場合には「ます」を付けた形で結ぶ。ここから、丁寧体を「ですます体」と呼ぶこともある。丁寧の度合いをより強め、「です」の代わりに「でございます」を用いた文体を、特に「でございます体」と呼ぶこともある。丁寧体は、敬語の面からいえば丁寧語を用いた文体のことである。なお、文末に形容詞が来る場合にも「です」で結ぶことはできるが「花が美しく咲いています」「花が美しゅうございます」などと言い、「です」を避けることがある。

文体の位相差

談話の文体(話体)は、話し手の性別・年齢・職業・場面など、位相の違いによって左右される部分が大きい。「ごはんを食べてきました」という丁寧体は、話し手の属性によって、たとえば、次のような変容がある。

  • ごはん食べてきたよ。(子どもや一般人のくだけた文体)
  • めし食ってきたぜ。(SNSや学生の粗野な文体)
  • 食事を取ってまいりました。(成人の改まった文体)

このように異なる言葉遣いのそれぞれを位相語と言い、それぞれの差を位相差という。

物語作品やメディアにおいて、位相が極端にステレオタイプ化されて現実と乖離したり、あるいは書き手などが仮想的(バーチャル)な位相を意図的に作り出したりする場合がある。このような言葉遣いを「役割語」と称することがある[108]。例えば以下の文体は、実際の性別・博士・令嬢・地方出身者などの一般的な位相を反映したものではないものの、小説・漫画・アニメ・ドラマなどで、仮想的にそれらしい感じを与える文体として広く観察される。これは現代に始まったものではなく、近世や近代の文献にも役割語の例が認められる(仮名垣魯文『西洋道中膝栗毛』に現れる外国人らしい言葉遣いなど)。

  • ごはん食べてきたわよ。(目上の女性)
  • わしは、食事をしてきたのじゃ。(博士風)
  • わたくし、お食事をいただいてまいりましてよ。(お嬢様風)
  • おら、めし食ってきただよ。(田舎者風)
  • ワタシ、ごはん食べてきたアルヨ。(中国人風。協和語を参照)

日本語では、待遇表現が文法的・語彙的な体系を形作っている。とりわけ、相手に敬意を示す言葉(敬語)において顕著である。

「敬語は日本にしかない」と言われることがあるが、日本と同様に敬語が文法的・語彙的体系を形作っている言語としては、朝鮮語ジャワ語ベトナム語チベット語ベンガル語タミル語などがあり、尊敬・謙譲・丁寧の区別もある[109]。朝鮮語ではたとえば動詞「내다(ネダ)」(出す)は、敬語形「내시다(ネシダ)」(出される)・「냅니다(ネムニダ)」(出します)の形を持つ。

敬語体系は無くとも、敬意を示す表現自体は、さまざまな言語に広く観察される。相手を敬い、物を丁寧に言うことは、発達した社会ならばどこでも必要とされる。そうした言い方を習得することは、どの言語でも容易でない。

金田一京助などによれば、現代日本語の敬語に特徴的なのは次の2点である。

  • 相対敬語である
  • 文法体系となっている

朝鮮語など他の言語の敬語では、たとえば自分の父親はいかなる状況でも敬意表現の対象であり、他人に彼のことを話す場合も「私のお父様は…」という絶対的敬語を用いるが、日本語では自分の身内に対する敬意を他人に表現することは憚られ、「私の父は…」のように表現しなければならない。ただし皇室では絶対敬語が存在し、皇太子は自分の父親のことを「天皇陛下は…」と表現する。

どんな言語も敬意を表す表現を持っているが、日本語や朝鮮語などはそれが文法体系となっているため、表現・言語行動のあらゆる部分に、高度に組織立った体系が出来上がっている[110]。そのため、敬意の種類や度合いに応じた表現の選択肢が予め用意されており、常にそれらの中から適切な表現を選ばなくてはならない。

以下、日本語の敬語体系および敬意表現について述べる。

敬語体系

日本語の敬語体系は、一般に、大きく尊敬語謙譲語丁寧語に分類される。文化審議会国語分科会は、2007年2月に「敬語の指針」を答申し、これに丁重語および美化語を含めた5分類を示している[111]

尊敬語は、動作の主体を高めることで、主体への敬意を表す言い方である。動詞に「お(ご)〜になる」を付けた形、また、助動詞「(ら)れる」を付けた形などが用いられる。たとえば、動詞「取る」の尊敬形として、「(先生が)お取りになる」「(先生が)取られる」などが用いられる。

語によっては、特定の尊敬語が対応するものもある。たとえば、「言う」の尊敬語は「おっしゃる」、「食べる」の尊敬語は「召し上がる」、「行く・来る・いる」の尊敬語は「いらっしゃる」である。

謙譲語は、古代から基本的に動作の客体への敬意を表す言い方であり、現代では「動作の主体を低める」と解釈するほうがよい場合がある。動詞に「お〜する」「お〜いたします」(謙譲語+丁寧語)をつけた形などが用いられる。たとえば、「取る」の謙譲形として、「お取りする」などが用いられる。

語によっては、特定の謙譲語が対応するものもある。たとえば、「言う」の謙譲語は「申し上げる」、「食べる」の謙譲語は「いただく」、「(相手の所に)行く」の謙譲語は「伺う」「参上する」「まいる」である。

なお、「夜も更けてまいりました」の「まいり」など、謙譲表現のようでありながら、誰かを低めているわけではない表現がある。これは、「夜も更けてきた」という話題を丁重に表現することによって、聞き手への敬意を表すものである。宮地裕は、この表現に使われる語を、特に「丁重語」と称している[112][113]。丁重語にはほかに「いたし(マス)」「申し(マス)」「存じ(マス)」「小生」「小社」「弊社」などがある。文化審議会の「敬語の指針」でも、「明日から海外へまいります」の「まいり」のように、相手とは関りのない自分側の動作を表現する言い方を丁重語としている。

丁寧語は、文末を丁寧にすることで、聞き手への敬意を表すものである。動詞・形容詞の終止形で終わる常体に対して、名詞・形容動詞語幹などに「です」を付けた形(「学生です」「きれいです」)や、動詞に「ます」をつけた形(「行きます」「分かりました」)等の丁寧語を用いた文体を敬体という。

一般に、目上の人には丁寧語を用い、同等・目下の人には丁寧語を用いないといわれる。しかし、実際の言語生活に照らして考えれば、これは事実ではない。母が子を叱るとき、「お母さんはもう知りませんよ」と丁寧語を用いる場合もある。丁寧語が用いられる多くの場合は、敬意や謝意の表現とされるが、稀に一歩引いた心理的な距離をとろうとする場合もある。

「お弁当」「ご飯」などの「お」「ご」も、広い意味では丁寧語に含まれるが、宮地裕は特に「美化語」と称して区別する[112][113]。相手への丁寧の意を示すというよりは、話し手が自分の言葉遣いに配慮した表現である。したがって、「お弁当食べようよ。」のように、丁寧体でない文でも美化語を用いることがある。文化審議会の「敬語の指針」でも「美化語」を設けている。

敬意表現

日本語で敬意を表現するためには、文法・語彙の敬語要素を知っているだけではなお不十分であり、時や場合など種々の要素に配慮した適切な表現が必要である。これを敬意表現(敬語表現)ということがある[114]

たとえば、「課長もコーヒーをお飲みになりたいですか」は、尊敬表現「お飲みになる」を用いているが、敬意表現としては適切でない。日本語では相手の意向を直接的に聞くことは失礼に当たるからである。「コーヒーはいかがですか」のように言うのが適切である。第22期国語審議会(2000年)は、このような敬意表現の重要性を踏まえて、「現代社会における敬意表現」を答申した。

婉曲表現の一部は、敬意表現としても用いられる。たとえば、相手に窓を開けてほしい場合は、命令表現によらずに、「窓を開けてくれる?」などと問いかけ表現を用いる。あるいは、「今日は暑いねえ」とだけ言って、窓を開けてほしい気持ちを含意することもある。

日本人が商取引で「考えさせてもらいます」という場合は拒絶の意味であると言われる。英語でも "Thank you for inviting me."(誘ってくれてありがとう)とは誘いを断る表現である。また、京都では、京都弁で帰りがけの客にその気がないのに「ぶぶづけ(お茶漬け)でもあがっておいきやす」と愛想を言うとされる(出典は落語「京のぶぶづけ」「京の茶漬け」よるという[115])。これらは、相手の気分を害さないように工夫した表現という意味では、広義の敬意表現と呼ぶべきものであるが、その呼吸が分からない人との間に誤解を招くおそれもある。

日本語には多様な方言がみられ、それらはいくつかの方言圏にまとめることができる。どのような方言圏を想定するかは、区画するために用いる指標によって少なからず異なる。

方言区画

日本語の方言区分の一例。大きな方言境界ほど太い線で示している。

東条操は、全国で話されている言葉を大きく東部方言・西部方言・九州方言および琉球方言に分けている[116]。またそれらは、北海道東北関東八丈島東海東山北陸近畿中国雲伯(出雲・伯耆)・四国豊日(豊前・豊後・日向)・肥筑(筑紫・肥前・肥後)・薩隅(薩摩・大隅)・奄美群島沖縄諸島・先島諸島に区画された。これらの分類は、今日でもなお一般的に用いられる。なお、このうち奄美・沖縄・先島の言葉は、日本語の一方言(琉球方言)とする立場と、独立言語として琉球語とする立場とがある。

また、金田一春彦は、近畿・四国を主とする内輪方言、関東・中部・中国・九州北部の一部を主とする中輪方言、北海道・東北・九州の大部分を主とする外輪方言、沖縄地方を主とする南島方言に分類した[117]。この分類は、アクセントや音韻、文法の特徴が畿内を中心に輪を描くことに着目したものである。このほか、幾人かの研究者により方言区画案が示されている。

一つの方言区画の内部も変化に富んでいる。たとえば、奈良県は近畿方言の地域に属するが、十津川村下北山村周辺ではその地域だけ東京式アクセントが使われ、さらに下北山村池原にはまた別体系のアクセントがあって東京式の地域に取り囲まれている[118]香川県観音寺市伊吹町(伊吹島)では、平安時代のアクセント体系が残存しているといわれる[119](異説もある[120])。これらは特に顕著な特徴を示す例であるが、どのような狭い地域にも、その土地としての言葉の体系がある。したがって、「どの地点のことばも、等しく記録に価する[121]」ものである。

東西の文法

一般に、方言差が話題になるときには、文法の東西の差異が取り上げられることが多い。東部方言西部方言との間には、およそ次のような違いがある。

否定辞に東で「ナイ」、西で「ン」を用いる。完了形には、東で「テル」を、西で「トル」を用いる。断定には、東で「ダ」を、西で「ジャ」または「ヤ」を用いる。アワ行五段活用動詞連用形は、東では「カッタ(買)」と促音便に、西では「コータ」とウ音便になる。形容詞連用形は、東では「ハヤク(ナル)」のように非音便形を用いるが、西では「ハヨー(ナル)」のようにウ音便形を用いるなどである[122]

方言の東西対立の境界は、画然と引けるものではなく、どの特徴を取り上げるかによって少なからず変わってくる。しかし、おおむね、日本海側は新潟県西端の糸魚川市、太平洋側は静岡県浜名湖が境界線(糸魚川・浜名湖線)とされることが多い。糸魚川西方には難所親不知があり、その南には日本アルプスが連なって東西の交通を妨げていたことが、東西方言を形成した一因とみられる。

アクセント

日本語のアクセント分布

日本語のアクセントは、方言ごとの違いが大きい。日本語のアクセント体系はいくつかの種類に分けられるが、特に広範囲で話され話者数も多いのは東京式アクセント京阪式アクセントの2つである。東京式アクセントは下がり目の位置のみを弁別するが、京阪式アクセントは下がり目の位置に加えて第1拍の高低を弁別する。一般にはアクセントの違いは日本語の東西の違いとして語られることが多いが、実際の分布は単純な東西対立ではなく、東京式アクセントは概ね北海道東北地方北部、関東地方西部、甲信越地方東海地方の大部分、中国地方四国地方南西部、九州北東部に分布しており、京阪式アクセントは近畿地方・四国地方のそれぞれ大部分と北陸地方の一部に分布している。すなわち、近畿地方を中心とした地域に京阪式アクセント地帯が広がり、その東西を東京式アクセント地域が挟む形になっている。日本語の標準語・共通語のアクセントは、東京の山の手言葉のものを基盤にしているため東京式アクセントである。

九州西南部や沖縄の一部には型の種類が2種類になっている二型アクセントが分布し、宮崎県都城市などには型の種類が1種類になっている一型アクセントが分布する。また、岩手県雫石町山梨県早川町奈良田などのアクセントは、音の下がり目ではなく上がり目を弁別する。これら有アクセントの方言に対し、東北地方南部から関東地方北東部にかけての地域や、九州の東京式アクセント地帯と二型アクセント地帯に挟まれた地域などには、話者にアクセントの知覚がなく、どこを高くするという決まりがない無アクセント(崩壊アクセント)の地域がある。これらのアクセント大区分の中にも様々な変種があり、さらにそれぞれの体系の中間型や別派なども存在する。

「花が」が東京で「低高低」、京都で「高低低」と発音されるように、単語のアクセントは地方によって異なる。ただし、それぞれの地方のアクセント体系は互いにまったく無関係に成り立っているのではない。多くの場合において規則的な対応が見られる。たとえば、「花が」「山が」「池が」を東京ではいずれも「低高低」と発音するが、京都ではいずれも「高低低」と発音し、「水が」「鳥が」「風が」は東京ではいずれも「低高高」と発音するのに対して京都ではいずれも「高高高」と発音する。また、「松が」「空が」「海が」は東京ではいずれも「高低低」と発音されるのに対し、京都ではいずれも「低低高」と発音される。このように、ある地方で同じアクセントの型にまとめられる語群(と呼ぶ)は、他の地方でも同じ型に属することが一般的に観察される。

この事実は、日本の方言アクセントが、過去の同一のアクセント体系から分かれ出たことを意味する[123]服部四郎はこれを原始日本語のアクセントと称し[124]、これが分岐し互いに反対の方向に変化して、東京式と京阪式を生じたと考えた。現在有力な説は、院政期京阪式アクセント名義抄式アクセント)が日本語アクセントの祖体系で、現在の諸方言アクセントのほとんどはこれが順次変化を起こした結果生じたとするものである(金田一春彦[125]や奥村三雄[126])。一方で、地方の無アクセントと中央の京阪式アクセントの接触で諸方言のアクセントが生じたとする説(山口幸洋[127])もある。

音声・音韻

発音の特徴によって本土方言を大きく区分すると、表日本方言、裏日本方言、薩隅(鹿児島)式方言に分けることができる[128]。表日本方言は共通語に近い音韻体系を持つ。裏日本式の音韻体系は、東北地方を中心に、北海道沿岸部や新潟県越後北部、関東北東部(茨城県・栃木県)と、とんで島根県出雲地方を中心とした地域に分布する。その特徴は、イ段とウ段の母音に中舌母音を用いることと、エが狭くイに近いことである。関東のうち千葉県や埼玉県東部などと、越後中部・佐渡・富山県・石川県能登の方言は裏日本式と表日本式の中間である。また薩隅式方言は、大量の母音脱落により閉音節を多く持っている点で他方言と対立している。薩隅方言以外の九州の方言は、薩隅式と表日本式の中間である。

音韻の面では、母音の「」を、東日本、北陸、出雲付近では中舌寄りで非円唇母音(唇を丸めない)の [ɯ] または [ɯ̈] で、西日本一般では奥舌で円唇母音[u] で発音する。また、母音は、東日本や北陸、出雲付近、九州で無声化しやすく、東海、近畿、中国、四国では無声化しにくい[129]

またこれとは別に、近畿・四国(・北陸)とそれ以外での対立がある。前者は京阪式アクセントの地域であるが、この地域ではアクセント以外にも、「木」を「きい」、「目」を「めえ」のように一音節語を伸ばして二拍に発音し、また「赤い」→「あけー」のような連母音の融合が起こらないという共通点がある。また、西日本(九州・山陰・北陸除く)は母音を強く子音を弱く発音し、東日本や九州は子音を強く母音を弱く発音する傾向がある。

音韻史

母音の数は、奈良時代およびそれ以前には現在よりも多かったと考えられる。橋本進吉は、江戸時代の上代特殊仮名遣いの研究を再評価し[130]記紀や『万葉集』などの万葉仮名において「き・ひ・み・け・へ・め・こ・そ・と・の・も・よ・ろ」の表記に2種類の仮名が存在することを指摘した(甲類・乙類と称する。「も」は『古事記』のみで区別される)。橋本は、これらの仮名の区別は音韻上の区別に基づくもので、特に母音の差によるものと考えた[131]。橋本の説は、後続の研究者らによって、「母音の数がアイウエオ五つでなく、合計八を数えるもの[132]」という8母音説と受け取られ、定説化した(異説として、服部四郎の6母音説[33]などがある)。8母音の区別は平安時代にはなくなり、現在のように5母音になったとみられる。なお、上代日本語の語彙では、母音の出現の仕方がウラル語族アルタイ語族母音調和の法則に類似しているとされる[27]

は行」の子音は、奈良時代以前には [p] であったとみられる[133]。すなわち、「はな(花)」は [pana](パナ)のように発音された可能性がある。[p] は遅くとも平安時代初期には無声両唇摩擦音 [ɸ] に変化していた[134]。すなわち、「はな」は [ɸana](ファナ)となっていた。中世末期に、ローマ字で当時の日本語を記述したキリシタン資料が多く残されているが、そこでは「は行」の文字が「fa, fi, fu, fe, fo」で転写されており、当時の「は行」は「ファ、フィ、フ、フェ、フォ」に近い発音であったことが分かる。中世末期から江戸時代にかけて、「は行」の子音は [ɸ] から [h] へ移行した。ただし、「」は [ɸ] のままに、「」は [çi] になった[135]。現代でも引き続きこのように発音されている。

このように、「は行」子音はおおむね [p][ɸ][h]唇音が衰退する方向で推移した。唇音の衰退する例は、ハ行転呼の現象(「は行」→「わ行」すなわち [ɸ][w] の変化)にも見られる。また、関西で「う」を唇を丸めて発音する(円唇母音)のに対し、関東では唇を丸めずに発音するが、これも唇音退化の例ととらえることができる。

や行」の「え」([je]) の音が古代に存在したことは、「あ行」の「え」の仮名と別の文字で書き分けられていたことから明らかである[136]。平安時代初期に成立したと見られる「天地の詞」には「え」が2つ含まれており、「あ行」と「や行」の区別を示すものと考えられる。この区別は10世紀の頃にはなくなっていたとみられ[136]、970年成立の『口遊』に収録される「大為爾の歌」では「あ行」の「え」しかない。この頃には「あ行」と「や行」の「え」の発音はともに [je] になっていた(次節参照)。

「が行」の子音は、語中・語尾ではいわゆる鼻濁音(ガ行鼻音)の [ŋ] であった。鼻濁音は、近代に入って急速に勢力を失い、語頭と同じ破裂音[ɡ] または