ibm-902_P100-1999

Windows-1252 (文字コード)

DEC MCS

[93] Wayback Machine, https://web.archive.org/web/20030411082837/http://library.ust.hk/scip98/papers/ho.pdf #page=21

[25] DEC MCS をみるとなぜ Latin1×÷がおかしな場所に挿入されているのか判明します。 DEC MCS ではラテン文字順で配置されていた文字を削除して、 他の文字の場所を変えないためにそこに割り当てたということです。

[22] 関連 : DECの文字コード

ISO/IEC 8859-1

[2] 規格については ISO/IEC 8859 参照。

[3] 符号化の名前については iso-8859-* も参照。

実利用例

[44] Seminarios Anteriores, , https://gente.itam.mx/jfdez/

[45] Cursos, , http://www1.inecol.edu.mx/soporte/cursos.htm

Windows

[29] EURO 追加の前後の変化 (Win95 (WindowsのNLSファイル (>>25)) と Win98 (WindowsのNLSファイル (>>26)) での調査結果)

 -0x01	U+263A	<-	# WHITE SMILING FACE
 -0x02	U+263B	<-	# BLACK SMILING FACE
 -0x03	U+2665	<-	# BLACK HEART SUIT
 -0x04	U+2666	<-	# BLACK DIAMOND SUIT
 -0x05	U+2663	<-	# BLACK CLUB SUIT
 -0x06	U+2660	<-	# BLACK SPADE SUIT
 -0x08	U+25D8	<-	# INVERSE BULLET
 -0x09	U+25CB	<-	# WHITE CIRCLE
 -0x0A	U+25D9	<-	# INVERSE WHITE CIRCLE
 -0x0B	U+2642	<-	# MALE SIGN
 -0x0C	U+2640	<-	# FEMALE SIGN
 -0x0D	U+266A	<-	# EIGHTH NOTE
 -0x0E	U+266B	<-	# BEAMED EIGHTH NOTES
 -0x10	U+25BA	<-	# BLACK RIGHT-POINTING POINTER
 -0x11	U+25C4	<-	# BLACK LEFT-POINTING POINTER
 -0x12	U+2195	<-	# UP DOWN ARROW
 -0x13	U+203C	<-	# DOUBLE EXCLAMATION MARK
 -0x16	U+25AC	<-	# BLACK RECTANGLE
 -0x17	U+21A8	<-	# UP DOWN ARROW WITH BASE
 -0x18	U+2191	<-	# UPWARDS ARROW
 -0x19	U+2193	<-	# DOWNWARDS ARROW
 -0x1A	U+2192	<-	# RIGHTWARDS ARROW
 -0x1B	U+2190	<-	# LEFTWARDS ARROW
 -0x1C	U+221F	<-	# RIGHT ANGLE
 -0x1D	U+2194	<-	# LEFT RIGHT ARROW
 -0x1E	U+25B2	<-	# BLACK UP-POINTING TRIANGLE
 -0x1F	U+25BC	<-	# BLACK DOWN-POINTING TRIANGLE
 -0x5A	U+017D	<-	# LATIN CAPITAL LETTER Z WITH CARON
 -0x7A	U+017E	<-	# LATIN SMALL LETTER Z WITH CARON
 -0x80	U+0080		# <control>
 +0x80	U+20AC		# EURO SIGN
 -0x8E	U+008E		# <control>
 +0x8E	U+017D		# LATIN CAPITAL LETTER Z WITH CARON
 -0x9E	U+009E		# <control>
 +0x9E	U+017E		# LATIN SMALL LETTER Z WITH CARON
 +0xA2	U+20A1	<-	# COLON SIGN

Windows-1252 実利用例

[32] Page d'accueil, , http://alquier.a.free.fr/nouvellepage3.htm

[33] tapis de rando en feutre, https://guichard-sellier.fr/boutique%20T/tapis/ft%20tapis%20trappeur.htm

[34] null, , https://www.lirmm.fr/~prost/enseignement/2011-2012/M1-TAL/ExtractionInformation/corpora/goldStandard/annot%C3%A9.v2/gs-grp5.v2.txt

[36] Servicio Hosting - Foros - Inicio, https://soporte.miarroba.com/?cat=11616

[38] Ergebnisse August 2007, , https://www.bridgeniederkassel.de/clubchronik.htm

[39] null, , https://listserv.zib.de/pipermail/scip/attachments/20191025/9c38b2fd/attachment.html

(ISO-8859-1 の範囲)

[40] <meta http-equiv="Content-Type" content="text/html; charset=windows-1252"> <title>Gitschberg-Adler - Wir über uns, Gleitschirm Club Gitschberg-Adler, , http://www.gitschberg-adler.de/Selbstdarstellung.htm

[41] Gruppenangebote Sachsen, , https://www.gruppenangebote.de/GASachsen.htm

[42] Publicações, , https://home.uevora.pt/~frei/publica%e7%f5es.htm

[43] <link rel="shortcut icon" href="favicon.ico"> <link rel="shortcut icon" href="http://www.renatoweb.it/favicon.ico"> <meta name="description" content="Renatoweb un piccolo sito di aiuto per fare e costruire pagine web."> <meta http-equiv="title" content="w, , https://www.renatoweb.it/centro.htm

[46] Museo de Ciencias de San Luis Potosí, , http://galia.fc.uaslp.mx/museo/fismat/

Web

[35] Webにおける文字コードUS-ASCIIISO-8859-1Windows-1252 です。

CP922

[16] IBM CP922 は、 ISO/IEC 8859-1 を一部改変したものです。

[17] IBM CP902 は、 CP922 を一部改変したものです。

ISO/IEC 8859-15

[1] ISO/IEC 8859-15 は実質的な ISO/IEC 8859-1 の改訂版で、非常によく似ていますが、 文字の入れ替えがあって互換性はありません。

実利用例

[47] How to use Latin 9 aka iso-8859-15, , http://je.org/latin9/

(charset に指定しているだけで、このファイル自体はASCII文字のみ)

[48] null, , https://www.math.nagoya-u.ac.jp/~garrigue/soft/olabl/lablgtk-list/old/1029.txt

(charset に指定しているだけで、このファイル自体はASCII文字のみ。 format=flowed)

[49] null, , https://lists.evolveum.com/pipermail/midpoint/attachments/20170412/771cca78/attachment.htm

(ISO-8859-1 と区別つかず)

[50] regional-de: =?iso-8859-15?Q?Fr=FChjahrsfachgespr=E4c?=, , https://mail-index.netbsd.org/regional-de/2006/01/29/0000.html

比較

[4] ASCII は狭義にはASCII印字可能文字 ([ 0x20, 0x7E ])、 広義には制御文字含み ([ 0x00, 0x7F ]) ですが、いずれにせよ本来は7ビット符号です。 MIME charset 等の us-asciiASCII を表しています。

[5] ISO/IEC 8859-1ASCII に更に G1 = GRラテン文字等を追加した8ビット符号です。 MIME charset 等の iso-8859-1ISO/IEC 8859-1 を表しています。

[6] Windows-1252ISO/IEC 8859-1CR に独自の図形文字を割り当てたものです。 ISO/IEC 8859 には適合しない Windows の独自の実装です。

[7] Windows-1252ISO/IEC 8859-1 と厳密には異なり互換性がないものですが、 平成時代半ばごろの Web の実態に基づき Encoding Standardus-asciiiso-8859-1 などを Windows-1252 の別名とみなしています。

[8] 更には、文字コード文字に限定されず、文字参照でも CRWindows-1252 の割当により解釈することとしています。 この取り扱いは、文字コードWindows-1252 でなくても (例えば UTF-8 でも) 適用されます。 文字参照

[9] 1対1対応部分についていえば Windows-1252ICUibm-5348_P100-1997, aix-IBM_1252-4.3.6 は同じです。

[10] ICUibm-1252_P100-2000Windows-1252 の旧版で、ユーロ記号がないなど少し違いがあります。

[11] ISO/IEC 8859-15ISO/IEC 8859-1 と共通部分が多いですが、 G1 の一部の図形文字が違っています。 Encoding StandardISO-8859-15Unicode ConsortiumISO/IEC 8859-15 変換表、 ICUibm-923_P100-1998 は1対1対応部分についていえば同じです。

[14] CP922ISO/IEC 8859-1 を一部改変したものです。 改変部分は Windows-1257 / ISO/IEC 8859-13 と同じ形に変更されています。 改変のためにどちらとも互換性がありません。 ICUibm-922_P100-1999, glibc-IBM922-2.3.3, java-Cp922-1.3_P があり、おおむね同等ですが、一部 Unicode との関係が違います。

[18] CP902CP922 を一部改変したもので、ユーロ記号への差し替えがあります。 ICUibm-902_P100-1999 があります。 差し替えのためにいずれとも互換性がありません。

[24] DEC MCSISO/IEC 8859-1 のもとになった文字コードです。 >>23 >>23DEC-MCSICUglibc-DEC_MCS-2.1.2 は、 ISO/IEC 8859-1 からみると一部の文字を削除したり、他の文字に入れ替えたり、場所を移動したりしたものです。 互換性はありません。

[27] RPL character set >>26 は、 ISO/IEC 8859-1制御文字を独自の図形文字に置き換えたものです。 互換性はありません。

[30] TI calculator character sets >>29 のうち TI-89/92 character set は、 ISO/IEC 8859-1制御文字や一部の図形文字を独自の図形文字に置き換えたものです。 互換性はありません。


[19] ISO/IEC 8859-9Windows-1254 は、 ISO/IEC 8859-1Windows-1252 の一部を改変したものです。 改変のためにいずれとも互換性がありません。

[12] ISO/IEC 8859-2ISO/IEC 8859-1 と共通部分が多いですが、違いもちらほらあります。 互換性はありません。

[20] この他に ISO/IEC 8859-3, ISO/IEC 8859-4, ISO/IEC 8859-10, ISO/IEC 8859-13, ISO/IEC 8859-14, ISO/IEC 8859-16, AdobeStandardEncoding, T.61ラテン文字符号ISO/IEC 8859-1 との類似性が意識されて設計されているようですが、 違いがかなり多いです。

[21] 同様に Windows-1250, Windows-1254, Windows-1257, Windows-1258, Windows-1270ラテン文字符号Windows-1260 との類似性が意識されて設計されているようですが、 違いがかなり多いです。 互換性はありません。

[31] Windows-1251, Windows-1253, Windows-1255, Windows-1256, Windows-874 などとも一部の文字だけが共通しています。 互換性はありません。

[13] Unicode の [ U+0000, U+00FF ] は ISO/IEC 8859-1 と同じです。 変換は容易ですが、 ISO/IEC 8859-18ビット符号であるのに対し Unicode の一般的な符号化方式のいずれもそうではないため、 符号化文字集合としての互換性はありません。

関連

[37] フォント依存符号化, OTF Windows NT compatibility mapping も参照。

メモ

[23] ISO 8859 Alphabet Soup, , http://czyborra.com/charsets/iso8859.html

[26] RPL character set - Wikipedia, , https://en.wikipedia.org/wiki/RPL_character_set

[28] TI calculator character sets - Wikipedia, , https://en.wikipedia.org/wiki/TI_calculator_character_sets#TI-89.2F92_Series