2011年02月18日
文字コードと改行コードを理解して文字化け対策
健康には注意してるのですが、偏頭痛に悩まされる日々が
続いて何もやる気が起こりません。
突然に襲ってくる偏頭痛に慣れてるとはいえ困っていて
やっぱり運動をしなきゃ駄目なのかなぁ…って思っています。凹
大切な物って失くしてから気付く事が多いんですけど
健康はお金で買えないし、健康管理をしっかりとしなきゃ……。
最近はブログの普及で見かけなくなったサイトの文字化けなんですが
データの受け渡しではまだまだ文字化けが多いんですよねぇ…
文字化けが起こる原因さえ理解してればいいんですょ。
ネットサーフィンをしていて、ホームページやブログが文字化けで
何が書いて有るのか分からないって経験がありませんか…?
友人からテキストファイルを貰ったけど文字化けでまったく読めない
ネットでダウンロードしたファイルがこれまた文字化けで読めない
こんな経験をされた人、多いと思います。
これは、作る側と見る側の文字コードと改行コードが違うために起こる現象なんです。
文字コードと改行コード、何のこっちゃ!と思う人が多いと思います。
以前は、機種依存文字も文字化けの要因に含まれていたのですが
現在、機種依存文字はユニコードで定義され普通に使えるようになりました。
■ 機種依存文字とは
マル囲いの数字やアラビア数字、メートルや株式会社を1文字分のスペースで
表示する文字の事をこう呼んでました。
インターネット上で使う文字コードには、以下の文字コードがあります。
ホームページのソースを見ると、どの文字コードで書かれているか分かります。
ウィンドウズの方は、ホームページ上で右クリック⇒ソースの表示をクリックすると
ソースが表示されます。ソースの上部にこんなメタタグがあります。
赤色の部分が文字コードの宣言です。
この場合だと、宣言したとおりに Shift_JIS コード で書かなければ成りません。
どうやって書くのって思いませんでしたか…?
ウインドウズをお使いであれば Shift_JIS コード は、何も考えなくて大丈夫です。
ノートパッド(メモ帳)やワードで保存した文書は、 Shift_JIS コード で保存されます。
他の文字コードで保存する場合は、複数の文字コードが扱えるテキストエディタが必要です。
ホームページやブログを見る場合は、ブラウザでの文字エンコーティングの設定を
自動判別に設定しておけば、ブラウザが勝手に判別してくれるので文字化けは
起こりにくいのですが、たま〜に有るんですよ…
手動で設定しても文字化けするサイトが…
推測なのですが、同一ページ内に複数の文字コードが混在していると思うンです。
フリーのスクリプトとか、ブログパーツをを貼り付けた時に起こるみたいですね。
ホームページをご自身で作ろうと思ってる人は、文字コードには注意して下さい。
ネットからダウンロードしたファイルが読めない、貰ったデータが読めない…
あなたもこんな経験があると思います。
■ 基本的に使うパンコンの OS が違うと文字コードと改行コードが異なります。
表を見ても分かるようにそれぞれ違いますよね・・・
Mac は os10 から Unix ベースの OS になったので Unix と同じです。
文字コードも違う、改行コードも違うわけだから文字化けしても当然ですよね…
なんとなく分かりますか…?
ウィンドウズ環境の場合は、ノートパッド(メモ帳)やワードでファイルを保存すると
このデータは、文字コードがShift_JIS 、改行コードが CR+LF で保存されます。
このデータをマックで見ても文字化けを起こすわけです。
反対にマックで作ったデータはウィンドウズでは文字化けを起こすわけです。
じゃ、他の OS環境の人にデータを渡すときはどうすればいいの…?
簡単です!渡す相手のOS環境に合わせたデータを作れば大丈夫です。
フリーで全ての文字コードと改行コードが扱えるテキストエディタがあります。
わたしが HTML や CSS を書くときに使ってるエディタで、TeraPadと言います。
ベクターでダウンロード出来るので、必要だって思ったらダウンロードして下さい。
http://www.vector.co.jp/soft/win95/writing/se104390.html
これは、アフィリエイトではありません(笑
ベクターのフリーソフトのコーナーでダウンロードできるフリーソフトです。
マック環境の方には、mi(ミミカキエディット)というエディタがあります。
ミミカキプロジェクト
他にもあると思うので、あなたが使い易いと感じるエディタを探してください。
なぜ、テキストエディタの利用を勧めるのかと言うと・・・
貰ったデータが文字化けをしても、読み込ませることが出来るからです。
それと、ブログなどにテキストをコピペする時などに起こるのですが
改行位置がずれてとんでも無い事になる場合があります。
実際に、ファンブログのHTMLとCSSをバックアップしてたものを
ブログにメモ帳でコピペしたら・・・オー・マイ・ガッ てな事がありました(笑
今回は、文字化けについてお話しをしたのですがいかがでしたか…?
かなりの人が経験あると思います。
でも、ほとんど意識していないと思います。
何でだろうで終わってませんか…?
これからは自分で調べる癖を付ける事も必要かも知れません。
教えて貰った事は忘れても、自分で必死に調べた事は忘れる事がありません。
まずは、自分で調べる事が大切なプロセスだと思っています。
私も時々、何時間もかけて必死こいて調べる時がありますよ…。
続いて何もやる気が起こりません。
突然に襲ってくる偏頭痛に慣れてるとはいえ困っていて
やっぱり運動をしなきゃ駄目なのかなぁ…って思っています。凹
大切な物って失くしてから気付く事が多いんですけど
健康はお金で買えないし、健康管理をしっかりとしなきゃ……。
最近はブログの普及で見かけなくなったサイトの文字化けなんですが
データの受け渡しではまだまだ文字化けが多いんですよねぇ…
文字化けが起こる原因さえ理解してればいいんですょ。
なぜ文字化けをするのだろうか
ネットサーフィンをしていて、ホームページやブログが文字化けで
何が書いて有るのか分からないって経験がありませんか…?
友人からテキストファイルを貰ったけど文字化けでまったく読めない
ネットでダウンロードしたファイルがこれまた文字化けで読めない
こんな経験をされた人、多いと思います。
これは、作る側と見る側の文字コードと改行コードが違うために起こる現象なんです。
文字コードと改行コード、何のこっちゃ!と思う人が多いと思います。
以前は、機種依存文字も文字化けの要因に含まれていたのですが
現在、機種依存文字はユニコードで定義され普通に使えるようになりました。
■ 機種依存文字とは
マル囲いの数字やアラビア数字、メートルや株式会社を1文字分のスペースで
表示する文字の事をこう呼んでました。
インターネットでの文字化け
インターネット上で使う文字コードには、以下の文字コードがあります。
Shift_JIS | EUC-JP | UTF-8 |
ホームページのソースを見ると、どの文字コードで書かれているか分かります。
ウィンドウズの方は、ホームページ上で右クリック⇒ソースの表示をクリックすると
ソースが表示されます。ソースの上部にこんなメタタグがあります。
<meta http-equiv="Content-Type" content="text/html;charset=Shift_JIS">
赤色の部分が文字コードの宣言です。
この場合だと、宣言したとおりに Shift_JIS コード で書かなければ成りません。
どうやって書くのって思いませんでしたか…?
ウインドウズをお使いであれば Shift_JIS コード は、何も考えなくて大丈夫です。
ノートパッド(メモ帳)やワードで保存した文書は、 Shift_JIS コード で保存されます。
他の文字コードで保存する場合は、複数の文字コードが扱えるテキストエディタが必要です。
ホームページやブログを見る場合は、ブラウザでの文字エンコーティングの設定を
自動判別に設定しておけば、ブラウザが勝手に判別してくれるので文字化けは
起こりにくいのですが、たま〜に有るんですよ…
手動で設定しても文字化けするサイトが…
推測なのですが、同一ページ内に複数の文字コードが混在していると思うンです。
フリーのスクリプトとか、ブログパーツをを貼り付けた時に起こるみたいですね。
ホームページをご自身で作ろうと思ってる人は、文字コードには注意して下さい。
もらったファイルが文字化け
ネットからダウンロードしたファイルが読めない、貰ったデータが読めない…
あなたもこんな経験があると思います。
■ 基本的に使うパンコンの OS が違うと文字コードと改行コードが異なります。
OSによる文字コードと改行コード | |||
Windows | Mac os10 | Mac | Unix |
Shift_JIS | EUC-JP | Shift_JIS | EUC-JP |
CR+LF | LF | CR | LF |
表を見ても分かるようにそれぞれ違いますよね・・・
Mac は os10 から Unix ベースの OS になったので Unix と同じです。
文字コードも違う、改行コードも違うわけだから文字化けしても当然ですよね…
なんとなく分かりますか…?
渡すデータを文字化けさせないためには
ウィンドウズ環境の場合は、ノートパッド(メモ帳)やワードでファイルを保存すると
このデータは、文字コードがShift_JIS 、改行コードが CR+LF で保存されます。
このデータをマックで見ても文字化けを起こすわけです。
反対にマックで作ったデータはウィンドウズでは文字化けを起こすわけです。
じゃ、他の OS環境の人にデータを渡すときはどうすればいいの…?
簡単です!渡す相手のOS環境に合わせたデータを作れば大丈夫です。
フリーで全ての文字コードと改行コードが扱えるテキストエディタがあります。
わたしが HTML や CSS を書くときに使ってるエディタで、TeraPadと言います。
ベクターでダウンロード出来るので、必要だって思ったらダウンロードして下さい。
http://www.vector.co.jp/soft/win95/writing/se104390.html
これは、アフィリエイトではありません(笑
ベクターのフリーソフトのコーナーでダウンロードできるフリーソフトです。
マック環境の方には、mi(ミミカキエディット)というエディタがあります。
ミミカキプロジェクト
他にもあると思うので、あなたが使い易いと感じるエディタを探してください。
なぜ、テキストエディタの利用を勧めるのかと言うと・・・
貰ったデータが文字化けをしても、読み込ませることが出来るからです。
それと、ブログなどにテキストをコピペする時などに起こるのですが
改行位置がずれてとんでも無い事になる場合があります。
実際に、ファンブログのHTMLとCSSをバックアップしてたものを
ブログにメモ帳でコピペしたら・・・オー・マイ・ガッ てな事がありました(笑
編集後記
今回は、文字化けについてお話しをしたのですがいかがでしたか…?
かなりの人が経験あると思います。
でも、ほとんど意識していないと思います。
何でだろうで終わってませんか…?
これからは自分で調べる癖を付ける事も必要かも知れません。
教えて貰った事は忘れても、自分で必死に調べた事は忘れる事がありません。
まずは、自分で調べる事が大切なプロセスだと思っています。
私も時々、何時間もかけて必死こいて調べる時がありますよ…。
Posted by 寿 一太朗 | 文字化けはどうして起こる | TOP▲ |