WinLatin1

Windows-1252 (文字コード)

目次

  1. ISO/IEC 8859-1
  2. Windows
  3. Web
  4. CP922
  5. ISO/IEC 8859-15
  6. 比較
  7. 関連
  8. メモ

ISO/IEC 8859-1#

[2] 規格については ISO/IEC 8859 参照。

[3] 符号化の名前については iso-8859-* も参照。

Windows#

[29] EURO 追加の前後の変化 (Win95 (WindowsのNLSファイル (>>25)) と Win98 (WindowsのNLSファイル (>>26)) での調査結果)

 -0x01	U+263A	<-	# WHITE SMILING FACE
 -0x02	U+263B	<-	# BLACK SMILING FACE
 -0x03	U+2665	<-	# BLACK HEART SUIT
 -0x04	U+2666	<-	# BLACK DIAMOND SUIT
 -0x05	U+2663	<-	# BLACK CLUB SUIT
 -0x06	U+2660	<-	# BLACK SPADE SUIT
 -0x08	U+25D8	<-	# INVERSE BULLET
 -0x09	U+25CB	<-	# WHITE CIRCLE
 -0x0A	U+25D9	<-	# INVERSE WHITE CIRCLE
 -0x0B	U+2642	<-	# MALE SIGN
 -0x0C	U+2640	<-	# FEMALE SIGN
 -0x0D	U+266A	<-	# EIGHTH NOTE
 -0x0E	U+266B	<-	# BEAMED EIGHTH NOTES
 -0x10	U+25BA	<-	# BLACK RIGHT-POINTING POINTER
 -0x11	U+25C4	<-	# BLACK LEFT-POINTING POINTER
 -0x12	U+2195	<-	# UP DOWN ARROW
 -0x13	U+203C	<-	# DOUBLE EXCLAMATION MARK
 -0x16	U+25AC	<-	# BLACK RECTANGLE
 -0x17	U+21A8	<-	# UP DOWN ARROW WITH BASE
 -0x18	U+2191	<-	# UPWARDS ARROW
 -0x19	U+2193	<-	# DOWNWARDS ARROW
 -0x1A	U+2192	<-	# RIGHTWARDS ARROW
 -0x1B	U+2190	<-	# LEFTWARDS ARROW
 -0x1C	U+221F	<-	# RIGHT ANGLE
 -0x1D	U+2194	<-	# LEFT RIGHT ARROW
 -0x1E	U+25B2	<-	# BLACK UP-POINTING TRIANGLE
 -0x1F	U+25BC	<-	# BLACK DOWN-POINTING TRIANGLE
 -0x5A	U+017D	<-	# LATIN CAPITAL LETTER Z WITH CARON
 -0x7A	U+017E	<-	# LATIN SMALL LETTER Z WITH CARON
 -0x80	U+0080		# <control>
 +0x80	U+20AC		# EURO SIGN
 -0x8E	U+008E		# <control>
 +0x8E	U+017D		# LATIN CAPITAL LETTER Z WITH CARON
 -0x9E	U+009E		# <control>
 +0x9E	U+017E		# LATIN SMALL LETTER Z WITH CARON
 +0xA2	U+20A1	<-	# COLON SIGN

Web#

[35] Webにおける文字コードUS-ASCIIISO-8859-1Windows-1252 です。

CP922#

[16] IBM CP922 は、 ISO/IEC 8859-1 を一部改変したものです。

[17] IBM CP902 は、 CP922 を一部改変したものです。

ISO/IEC 8859-15#

[1] ISO/IEC 8859-15 は実質的な ISO/IEC 8859-1 の改訂版で、非常によく似ていますが、 文字の入れ替えがあって互換性はありません。

比較#

[4] ASCII は狭義にはASCII印字可能文字 ([ 0x20, 0x7E ])、 広義には制御文字含み ([ 0x00, 0x7F ]) ですが、いずれにせよ本来は7ビット符号です。 MIME charset 等の us-asciiASCII を表しています。

[5] ISO/IEC 8859-1ASCII に更に G1 = GRラテン文字等を追加した8ビット符号です。 MIME charset 等の iso-8859-1ISO/IEC 8859-1 を表しています。

[6] Windows-1252ISO/IEC 8859-1CR に独自の図形文字を割り当てたものです。 ISO/IEC 8859 には適合しない Windows の独自の実装です。

[7] Windows-1252ISO/IEC 8859-1 と厳密には異なり互換性がないものですが、 平成時代半ばごろの Web の実態に基づき Encoding Standardus-asciiiso-8859-1 などを Windows-1252 の別名とみなしています。

[8] 更には、文字コード文字に限定されず、文字参照でも CRWindows-1252 の割当により解釈することとしています。 この取り扱いは、文字コードWindows-1252 でなくても (例えば UTF-8 でも) 適用されます。 文字参照

[9] 1対1対応部分についていえば Windows-1252ICUibm-5348_P100-1997, aix-IBM_1252-4.3.6 は同じです。

[10] ICUibm-1252_P100-2000Windows-1252 の旧版で、ユーロ記号がないなど少し違いがあります。

[11] ISO/IEC 8859-15ISO/IEC 8859-1 と共通部分が多いですが、 G1 の一部の図形文字が違っています。 Encoding StandardISO-8859-15Unicode ConsortiumISO/IEC 8859-15 変換表、 ICUibm-923_P100-1998 は1対1対応部分についていえば同じです。

[14] CP922ISO/IEC 8859-1 を一部改変したものです。 改変部分は Windows-1257 / ISO/IEC 8859-13 と同じ形に変更されています。 改変のためにどちらとも互換性がありません。 ICUibm-922_P100-1999 があります。

[18] CP902CP922 を一部改変したもので、ユーロ記号への差し替えがあります。 ICUibm-902_P100-1999 があります。 差し替えのためにいずれとも互換性がありません。

[19] ISO/IEC 8859-9Windows-1254 は、 ISO/IEC 8859-1Windows-1252 の一部を改変したものです。 改変のためにいずれとも互換性がありません。

[12] ISO/IEC 8859-2ISO/IEC 8859-1 と共通部分が多いですが、違いもちらほらあります。 互換性はありません。

[20] この他に ISO/IEC 8859-3, ISO/IEC 8859-4, ISO/IEC 8859-10, ISO/IEC 8859-13, ISO/IEC 8859-14, ISO/IEC 8859-16ラテン文字符号ISO/IEC 8859-1 との類似性が意識されて設計されているようですが、 違いがかなり多いです。

[21] 同様に Windows-1250, Windows-1254, Windows-1257, Windows-1258, Windows-1270ラテン文字符号Windows-1260 との類似性が意識されて設計されているようですが、 違いがかなり多いです。

[13] Unicode の [ U+0000, U+00FF ] は ISO/IEC 8859-1 と同じです。 変換は容易ですが、 ISO/IEC 8859-18ビット符号であるのに対し Unicode の一般的な符号化方式のいずれもそうではないため、 符号化文字集合としての互換性はありません。

関連#

[37] フォント依存符号化, OTF Windows NT compatibility mapping も参照。

メモ#