カタカナ

日本語の表音文字の一つ。外来語、擬音語、学術用語の表記に使われる。

カタカナは日本語の表音文字の一つで、46 文字の基本字母 (清音) に濁音・半濁音・拗音を加えた体系で構成されます。平安時代に漢字の一部 (偏や旁) を簡略化して作られた文字で、角張った直線的な字形が特徴です。ひらがなが漢字の草書体から生まれたのに対し、カタカナは漢字の一部分を取り出して成立した点が異なります。

カタカナの主な用途は外来語の表記です。「コンピュータ」「インターネット」「プログラミング」のように、英語をはじめとする外国語から取り入れた語彙をカタカナで表記します。IT 分野では特にカタカナ語が多く、「サーバー」「データベース」「アルゴリズム」など、技術文書の相当部分をカタカナが占めることも珍しくありません。日本語表記ルールの書籍でカタカナの使い方が詳しく解説されています。

外来語以外にも、擬音語・擬態語 (ガタガタ、キラキラ、ドキドキ)、動植物の和名 (ネコ、サクラ)、強調表現、電報文などにカタカナが使われます。広告やマンガでは、通常ひらがなで書く語をあえてカタカナにすることで視覚的なインパクトを与える手法も一般的です。

Unicode では全角カタカナは U+30A0〜U+30FF の範囲に配置されています。一方、半角カタカナは U+FF65〜U+FF9F に別途定義されており、これは 1980 年代の日本のコンピュータで 1 バイトで表現できるカタカナとして使われていた名残です。半角カタカナは濁点・半濁点が独立した文字として扱われるため、「ガ」は半角では「ガ」(2 文字) となり、文字数カウントに影響します。

カタカナ表記にはいくつかの揺れがあり、実務上の注意点となっています。たとえば「コンピュータ」と「コンピューター」、「サーバ」と「サーバー」のように、長音符号の有無で表記が分かれます。JIS 規格では 3 音以上の語の末尾長音を省略する慣例がありましたが、2019 年の改定で長音を付ける方向に統一されつつあります。日本語入力の書籍ではカタカナの効率的な入力方法も紹介されています。

文字数カウントの観点では、全角カタカナも半角カタカナもそれぞれ 1 文字としてカウントされます。ただし UTF-8 でのバイト数は全角カタカナが 3 バイト、半角カタカナも 3 バイトです。半角カタカナの濁点・半濁点は独立した文字 (結合文字ではない) として扱われるため、見た目の文字数と実際のカウント結果が異なる場合があります。テキスト処理では Unicode 正規化 (NFC/NFKC) を適用して全角に統一することが推奨されます。