機種とは?

機種依存文字(きしゅいぞんもじ)とは、電子的に扱う文字データのうち、処理系(ソフトウェアおよびハードウェア)によって違う文字に表示されたり、表示・印刷できなかったりするものの慣用的な総称である。JEFやJIPS等のようなメインフレーム/汎用機用の符号化文字集合については、コード体系そのものが機種依存するという前提があるため、本項では扱わない。
日本語の文字コード体系は、JIS C 6226-1978によって第一水準漢字、第二水準漢字、非漢字として規格化されたが、これらは実際の文書作成の際に必要となる記号や組文字を十分に組み込んだものではなかった。そして、コード空間の空き領域(09区〜15区)は「一時的・局所的に文字を割り当てて使用しても構わない」自由領域とされた(この規定は1997年のJIS X 0208-1997から削除)。
そのため、コンピュータメーカー各社はそれぞれ独自に拡張した記号類をこの領域に収録し、外字領域として扱われることになった。コンピュータの機種によって違う文字が表示されるコード領域となったのである。
1987年頃から主要なパソコン通信サービスが開始されるようになり、多くのパソコンがホスト局に接続され、電子掲示板や電子メールなどで文章のやり取りが行われるようになると、特に問題となったのがPC-9800シリーズとMacintosh・DOS/V間での表示の相違であったことから、これらのコードをパソコン通信等の世界では「機種依存文字」、または当時PC-9800シリーズのシェアが多かったために、PC-9800(あるいはエプソンのPC-9800互換機)シリーズでしか表示できない文字として「98文字」(キューハチ文字)と呼ぶようになったのである。
現在は、Macintosh以外のパソコンではオペレーティングシステムとして広くMicrosoft Windowsが用いられて文字表示はOSの役割となっている上、使用するフォントセットによって拡張文字の表示は変化するため、パソコンでは「機種依存文字」の呼称は正確性を失うものとなった。また、機種依存文字の代表格であった丸囲い数字、ローマ数字などはUnicodeに収録され規格内のコードとなった。しかし、歴史的な経緯から、表示に関して機種依存性が高い文字の総称として現在も使用されている。この意味では半角カナも広い意味で機種依存文字ということができる。
なお機種依存文字の定義があいまいになった現在においても、典型的な機種依存文字であると言えるのが、携帯電話のインターネット接続サービス(NTTドコモのiモードなど)対応電話機の「絵文字」のような文字である。これらの文字はShift_JISのユーザ拡張領域[1]やUnicodeの私的領域に登録されており、他の機種においては別の実装をされている可能性が著しく高いからである。
1980年代においては、以下の理由により、ベンダ定義文字(各コンピュータメーカーが、公的規格には無い文字を独自に拡張して搭載した文字)が、機種依存文字であるという定義が成り立っていた。
ただし、公的規格であっても、以下のような文字は、規格が普及・定着するまでは機種依存文字とされることがあった。
以下の理由により2000年代現在では、機種依存文字について、「どんな機種でも表示できるとは言えない文字」、若しくは、「異機種間のデータ交換の際に文字化けする確率が高い文字」という程度の定義しか出来ない。
一般的なパソコンにおけるOSのシェアの大半をWindowsが握っているため、データ交換時はWindowsが表示できる文字を利用すれば大抵の場合、文字化けは起こらない(例外についてはこちらを参照)。
JIS X 0213:2004の一部の文字などは公的規格の文字にもかかわらず、使える機種がWindows Vista搭載のPC等、ごく一部の機種に限られてしまうという実情がある。
Macintoshが機種依存文字で問題を発生させるようになった原因として、Windowsは1992年という早い段階からWindows標準システム外字に統一されたのに対して、Macintoshは二転三転を繰り返してきたことも挙げられる[3]。
文字が正しく表示できないことについては、「どのように(How)表示出来なかったのか」という観点と、「なぜ(Why)表示出来なかったのか」という観点の二種類から語ることが出来る。
「〓(ゲタ)」「・(中黒)」「□(豆腐)」等の文字に置換されて表示された場合というのは、大抵の場合、エンコーディングは一致しているものの、フォントセットを表示側のシステムが用意していない時である
別の文字として表示(文字化け)された場合というのは、エンコーディングが違うか、システム固有の登録文字を他システムで表示しようとしている時である。
この中で、「フォントセットを表示側のシステムが用意していない」場合と「特定のシステムに固有の登録文字を他システムで表示しようとしている」場合が「機種依存」であるとされる。
機種依存文字に関しては、ネチケットを取り扱っているWebページ等、色々な所で議論されることもあるが、2006年現在の所、オペレーティングシステムとしてMicrosoft Windowsがシェアとして非常に多い状況となっており、また他のオペレーティングシステムを殆ど使用したことがない人、Mac OSやLinuxなどの、別のオペレーティングシステムにてテストする環境が一切ない人も少なくない。そのため、コンピュータの初心者は言わずもがなだが、上級者であっても、所謂コンピュータ会社や工学部のある大学、インターネットサービスプロバイダのWebページ、またそこから送信されるEメールの文章等に、公然とNEC特殊文字やIBM拡張文字が含まれている[4]ことも往々にして存在する。同様にそれを閲覧する側にも、Microsoft Windowsを利用している人が多い為、それを指摘しない、指摘できない、気づかない、指摘する必要が無い場合も多く、しばし放置されている事が多いのが現状である。
しかし、少数でもLinuxやMac OSなどを使用しているユーザーが世界に存在している以上、Webページを制作したり、ブログを書いたり、BBSを使用したり、Eメールを送信したり、DTP編集にかけるためのテキスト原稿を提出したりする[5]場合には、機種依存文字の問題について注意を払うべきである。
将来的にはUnicodeが文字コードの標準になると思われるが、Unicodeに対応していないウェブブラウザ搭載の携帯電話が大量に普及してしまったため標準化にはしばらく時間がかかると思われる。
^ CP932においてユーザ拡張領域と定められているに過ぎず、JIS X 0208:1997においては拡張そのものが禁止されている。
^ それゆえかどうかは不明であるが、iモードのShift_JISにおいてはNEC特殊文字はWindowsのShift_JISと同様のコードポイントで利用可能である。
^ なぜ、このようなことが可能なのかと言うと、Windowsのメーラソフトが扱う文字符号化方式は純然たるISO-2022-JPではなく、それを拡張したCP50220であることが多いためである。

[ 102] 機種依存文字 - Wikipedia
[引用サイト]  http://ja.wikipedia.org/wiki/%E6%A9%9F%E7%A8%AE%E4%BE%9D%E5%AD%98%E6%96%87%E5%AD%97



お気に入り



  • track feed
    • seo