プログラムは、文字列の処理に ansi と unicode の二つを使用しています。今回は短いながらも、 ansi と unicode との相互変換について説明します。 ansi と unicode の違い 変換処理について 変換時の問題 追記 ansi と unicode の違い まず一番に、 ansi は(最低) ところが、「日本語 Windows で ANSI と呼ばれている Shift_JIS」は、 実は Shift_JIS に Microsoft が独自拡張を加えたもので、本来は CP932(コードページ932)という文字コードです。 つまり、UnicodeはASCII、ISO 8859-1、JIS X 0201と同格の文字コード系として紹介している。 これは、ちょっと、だいぶ端折った、不正確な説明であるので、補足する。 Unicodeとは何か Unicodeは、世界中の文字を一括して登録することを目標にした文字コード系である。 前回は、 一般的な文字列リテラルに、制御コード等を記述するためのエスケープシーケンスについて解説した。これの発展形、というか、より柔軟な指定ができ自由度の高い制御方法として、ansiエスケープコードというものがある。 ソースコードの記述に使う文字集合はansi-c:1989(iso/iec 9899:1990)ではasciiを標準としている。他のiso 646でも書けるように、3文字利用したトライグラフと呼ばれる表記法も存在する。 またマルチバイト文字とは8bit文字とそれ以上の文字が混在しているものの事で、ansi-cではこれらに対する考慮が加えられました。例としてワイド文字になる漢字コードとしては unicodeなどが有名ですね。 「初心者のためのポイント学習C言語」 Copyright(c) 2000-2004 TOMOJI All Rights …