インターネットメールと文字

よく言われる「機種依存文字」ってなに?
使っちゃいけない文字って?


インターネットメールやネットニュースで日本語を扱うためにISO-2022-JPというルールがあります。
これはUS-ASCII(いわゆる半角英数と記号)やJISローマ字コード、JIS73/JIS83で決められたコードを利用するのですが、裏を返せばこれ以外の文字は利用できないということになります。
「<ESC>$B[次の文字セット][文字列]」という形になってまして、[文字セット]がUS-ASCIIかJIS78かJIS83しかないですからこれ以外のものは表現できません。

問題になることと言えばこの規格では表が全部埋まってません。
それをいいことに各メーカーが勝手に空いてるところに文字を割り振ったりなんかしていました。
機種(OS)によって見え方が違うので機種依存文字なんて呼ばれたりしますが。
スタンドアロンで利用しているときはそれでも困らなかったのですが、ネットワークでつながるようになって問題になるようになりました。
例えば外字は基本的にはその外字を作ったマシンでしか表示できない(他のマシンで見るには外字も持っていかなきゃ)といったことが、機種やOS、フォントによって起きるようになったのです。

例えばローマ数字(IVなど)や丸で囲まれた数字あたりはNECが空いてるコードに勝手にそういう文字を割り当てただけなので, 基本的には98でしか見えません(Windows環境(TrueTypeフォントなど)なんかでは見えることが多いですけど)。
この辺の文字をMacで見ると(月)(火)のように見えたりするそうですし、X68000なんかだと笑った顔や泣いた顔なんかが表示されるそうでなかなか笑える、という話も。

さらに厄介なことに78年版、83年版、90年版、97年版の中で互換性がなかったりする部分もあります(新JIS、旧JISなんて聞いたことがある人がいるのではないでしょうか)。
もっとも変更するからにはなにかが変わってるのですが、字体が入れ代わったり追加されたりするので意図しない結果を生むこともあります。

世の趨勢がいわゆる新JISになるにしたがって「使っていいけど98DOSでは見えない」なんていう文字も出てきます(♪など)。
NECの98の漢字ROMが旧JIS(JIS78)にしか対応してない(=現在主流のJIS83ではない)ので、誤解を恐れずに言ってしまえば「98が悪い」となります。
この場合は「98DOSで電子メールを使う人はほとんどいないだろう」ということで、98DOSの人にはあきらめてもらうしかありません。
↑そういう人にはそういう文字を含んだメールを送らないようにすれば済む話ですけど。
ちなみにウチのEPSON PC-486GRではDOSでもちゃんと見えます(^_^)v。さすがEPSON!
Windowsの走らない98でインターネットという環境はそんなにないと思うので、そんなに気にすることもないでしょう。

同じように半角のカタカナもやはり使ってはいけない部類に入ります。
インターネットが育ったUNIXの環境では半角かなは基本的には使えません(シフトJISを採用しているHPのは使えるらしいです)。
ということで、必然的に転送するときの半角かなについては取り決めがありません。
文字の形以前にiso-2022-jpで規定されていないので、メールやニュースでは表現しようにもできないのです(それ以外の環境(パソコン通信やフロッピーでのやりとり)ではたいてい問題なしです)。
一部使えるように見えるものもありますが、独自の表現方法を取っている(NetscapeMail は <ESC>(I を半角カナの前に置き、MS Internet Mail は ^N と ^Oで半角カナの前後を挟むなど)ため他社のツールではうまく取り扱うことができません。

あ、あとカタカナは気をつけても半角で句読点やかぎかっこ、伸ばす音、なかぐろ(・)を使っちゃう人が多いです。
これはキャラクタコード表をみると分かるのですが、カタカナと同じ扱いになるのでやっぱり使えません。
結構盲点だったりします。


...と能書きをたれても仕方ないので、使っていい文字。

<<< 文字・数字 >>>

0123456789
ABCDEFGHIJKLMNOPQRSTUVWXYZ
abcdefghijkmnopqrstuvwxyz

0123456789
ABCDEFGHIJKLMNOPQRSTUVWXYZ
abcdefghijklmnopqrstuvwxyz

あいうえおかきくけこさしすせそたちつてとなにぬねの
はひふへほまみむめもやゐゆゑよらりるれろわをん
ぁぃぅぇぉっゃゅょゎ
アイウエオカキクケコサシスセソタチツテトナニヌネノ
ハヒフヘホマミムメモヤヰユヱヨラリルレロワヲン
ァィゥェォッャュョヮ
゛゜ー

漢字は...いわゆる第一水準、第二水準文字はOKです。

<<< 記号 >>>

!"#$%&'()*+,-./:;<=>?@[\]^_`{|}~

 !”#$%&’()*+,−./:;<=>?@[¥]^_`{|} ̄

:;?!´`¨^ ̄_ヽヾゝゞ〃仝々〆〇―‐/\〜‖|…‥‘’“”・、。
()〔〕[]{}〈〉《》「」『』【】±×÷≠≦≧∞∴♂♀°℃
¢£§☆★○●◎◇◆□■△▲▽▼※〒→←↑↓〓

∈∋⊆⊇⊂⊃∪∩∧∨¬⇒⇔∀∃∠⊥⌒∂∇≡≒≪≫√∽∝∵∫∬ʼn♯♭♪†‡¶←この辺はJIS83で追加されたのかな?

<<< JIS罫線 >>>

─│┌┐┘└├┬┤┴┼━┃┏┓┛┗┣┳┫┻╋┠┯┨┷┿┝┰┥┸╂

これは一応大丈夫なんですけど、間違ってNEC罫線使ってもぱっと見わからないので使わないに越したことはないです。

<<< ギリシャ文字 >>>

ΑΒΓΔΕΖΗΘΙΚΛΜΝΞΟΠΡΣΤΥΦΧΨΩ
αβγδεζηθικλμνξοπρστυφχψω

<<< ロシア文字 >>>

АБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ
абвгдеёжзийклмнопрстуфхцчшщъыьэюя


逆に今度は使ってはいけない文字。
ちょっと小さいかな?

<<< 半角カタカナ >>>

これはシフトJISでは定義されていますがJISでは定義されていませんので使えません。

<<< 機種依存文字 >>>

こちらはコード自体は有効らしいのですが、どんな文字が出るかは環境によるのでできれば使わない方が...。

他にも2バイト半角やMac拡張(?)などなどここの環境だと取れないものがあるので、参考までにリンクなど。

通信では使ってはいけない文字
↑JIS罫線やJIS83で拡張された部分も使ってはいけない文字になってますが、この辺は考え方の問題ですかね。
情報交換用漢字符号系 JIS X 0208
↑似たような文字とかあるのでこれは一度見てみた方がいいです。
Windowsに標準装備の文字コード表と見比べると「この辺がだめなんだな」というのが見えてきます。
機種依存文字について

お勉強したい人むけドキュメント


最後に一言(まだあるのかよ^^;)。

「使ってはいけない」と書いたいわゆる機種依存文字ですが、これは相手の環境がその文字を自分の意図するように表示されると確信できる場合(相手もWindowsマシンだ、とか)には使用してもそんなにか問題ないんじゃないですかね。
規定されてないので違反っちゃ違反かもしれませんが。
ただ、途中でコード変換とかされちゃうとまずいかも。 ExchangeサーバとかNotesとかそういう特殊(?)なシステム使ってるとこだといらん処理加えてくれる可能性あるので注意。 だめだったらその部分を修正後再送して、「この人には丸付き数字は送っちゃいけないんだな」と肝に銘じましょう(笑)。
相手が不特定な場合にも読めないだけで動作に支障をきたすことはないと思いますが、読めないということは意図がうまく伝わらない可能性がありますし(機種名や箇条書きでローマ数字や○付き数字を使うといちばん肝心なところがわからなかったりね^^;)、読む側も気分的にすっきりしませんので避けましょう、ということです。

同じように特定個人宛メールでNetscape同士、Microsoft同士なら半角かなだろうとHTMLメールだろうとリッチテキストだろうとなんでもいいんですけど、慣れると不特定/特定多数宛のメールで使ってしまいかねないので注意が必要です。

半角カタカナは「メール本文では使えない」というだけなので、添付ファイルとして送ってあげるとよいでしょう。
それでもダメならlzhやzipに詰め込んで、というのも手ですね。
↑日本語の扱えない環境の人から日本語のファイルを送ってもらうときにやりましたが、似たようなことです。
でも本文などでは使っちゃダメですよ。
Becky!では送信時に自動的に全角に変換するので送ろうにも送れませんが(^-^)。
逆にMicrosoftやNetscapeが独自形式で送り出した半角かなをちゃんと見分けて表示してくれる賢いBecky!さんでした☆


※本文ではJIS X 0201-1976をJISローマ字コード、JIS X 0208-1978をJIS78、JIS X 0208-1983をJIS83と表記しました。
後者はそれぞれ旧JIS、新JISと呼ばれてるものですね。


ひとつ上へ。
Becky!非公式ホームページへ。