ver 1.02 (2011/07/04)
- Unicode 6.1.0ドラフト1版(EastAsianWidth-6.1.0d1.txt)に対応。
- U+1F16C…U+1F16Fを未使用に修正。
ver 1.01g (2011/04/25)
ver 1.01f (2010/12/09)
- 諸橋大漢和の変換表を若干更新(Ext-C、Ext-Bは既に対応済み、UROについて作業中)
- 期限を1月末に延長しました。
ver 1.01e (2010/09/25)
- Unicode 6.0.0ドラフト3版(EastAsianWidth-6.0.0d3.txt)に対応。インドのルピー通貨記号など、後に追加された文字の網羅。
ver 1.01d (2010/08/19)
- SJISで出力時、SJISに無い文字を出力するさい、不正な符号が出てしまうことがあったのを修正。
- Unicode 6.0.0ベータテスト版(ドラフト1)に対応。ISOのドラフト仕様からUnicodeのベータ仕様への絵文字の仕様変更に対応するため以下のように変換表を変更した。
- ドコモ絵文字(イーモバイル、ウィルコム含む)で、以下のUnicodeとのマッピングを変更
- f9a7 158 exclamation
- f8eb 77 TV
- f9f8 拡72 ウッシッシ
- f995 140 わーい(嬉しい顔)
- f9c7 拡23 冷や汗
- f9cf 拡31 うれしい顔
- f9ce 拡30 ウィンク
- f9c6 拡22 ほっとした顔
- f9cb 拡27 目がハート
- f9d1 拡33 猫2
- f9ca 拡26 ボケーっとした顔
- f9c8 拡24 冷や汗2
- f9c5 拡21 考えてる顔
- f998 143 もうやだ~(悲しい顔)
- f9cd 拡29 あっかんべー
- f997 142 がく~(落胆した顔)
- f996 141 ちっ(怒った顔)
- f9c9 拡25 ぷっくっくな顔
- f9d3 拡35 涙
- f9d0 拡32 がまん顔
- f9d2 拡34 泣き顔
- f9fc 拡76 げっそり
- f999 144 ふらふら
- f8bc 30 電車
- f8c1 35 バス
- 以下を削除
- f984 122 フリーダイヤル
- f9ae 165 ー(長音記号1)
- f9d9 拡41 マル秘
- au絵文字で、以下のUnicodeとのマッピングを変更
- f65a 2 !
- f3d1 702 イギリス国旗
- f6d5 80 顔1
- f6d3 50 小顔
- f485 814@ うっしっし
- f468 786@ 泣き笑い
- f649 257@ 顔1(うれしいカオ)
- f7f3 348 ウインク
- f3a1 454@ にこにこ
- f399 446@ てれてれ
- f7f4 349 目がハート
- f393 440@ ふっ
- f39d 450 横目
- f7f6 351 困り
- f394 441@ しょぼり
- f397 444 わからん
- f3a3 456 チュッ
- f3a2 455 チュー2
- f6c0 264 からかう(あっかんべえ)
- f64a 258 顔2(おこったカオ)
- f461 779 ぷー(かわいく怒)
- f46d 791 涙ぽろり
- f396 443@ 失敗
- f395 442 勝ち誇り
- f39a 447 青ざめ
- f46b 789@ ほえー
- f398 445 眠い
- f64c 260@ 顔4(つかれたカオ)
- f64b 259@ 顔3(かなしいカオ)
- f39f 452 あせり
- f7f5 350@ ショッキング
- f39e 451 びっくり
- f39c 449@ 熱
- f7cb 327* ふらふら
- f39b 448@ 風邪ひき
- f484 813@ うっしっし(ネコ)
- f467 785@ 泣き笑い(ネコ)
- f465 783@ にこ(ネコ)
- f469 787 目がハート(ネコ)
- f46e 792@ きりり(ネコ)
- f464 782 チュー(ネコ)
- f462 780 ぶー(かわいく怒)(ネコ)
- f46c 790@ 涙ぽろり(ネコ)
- f46a 788@ ほえー(ネコ)
- f3ab 464 NG
- f3ac 465 OK!2
- f3ad 466 平謝り
- f454 766 見ざる
- f456 768 聞かざる
- f455 767 言わざる
- f48a 819 キャラクター(挙手)
- f48b 820@ キャラクター(万歳)
- f48c 821@ キャラクター(しょんぼり)
- f48d 822@ キャラクター(かわいく怒る)
- f3a6 459 ゴメン/お願い
- f68e 172 電車
- f688 216 バス
- 以下を削除
- f6ca 279 丸秘
- f36c 402@ 祝マーク
- ソフトバンク絵文字で、以下のUnicodeとのマッピングを変更
- f961 33 ビックリ
- fbb0 439 イギリス
- fb44 351 エッヘン
- fb52 365 泣いたり笑ったり
- f998 87 喜
- fb55 368 あははと笑う
- fb45 352 ウィンク
- f997 86 楽
- fb4a 357 酔っぱらい
- f746 96 ラブラブ
- fb42 349 ほくそえんでいる
- fb4e 361 しらけ顔
- f748 98 タラー
- fb43 350 ひたすらごめんなさい
- fb47 354 目がぐるぐる
- fb58 371 投げKISS
- fb57 370 KISS:動く口
- f745 95 アカンベー
- fb49 356 あっかんべー
- f999 88 哀
- f99a 89 怒
- fb56 369 めちゃめちゃ怒っている
- fb53 366 可愛く泣いてる人
- fb46 353 わさびがきいた
- fb41 348 アセリ
- fb4b 358 ゲロゲロ
- fb48 355 鼻ちょうちん
- fb51 364 泣き
- fb4f 362 冷や汗
- f747 97 ガビーン
- fb50 363 びっくり
- fb4d 360 顔が赤くなる
- fb4c 359 マスクをつけた顔
- fb63 382 ×
- fb64 383 ○
- fb66 385 土下座
- fb67 386 バンザイ
- fb5d 376 ごめんなさい
- f95e 30 電車
- f79a 179 バス
- 以下を削除
- f76c 134 歌い出し
- f9ad 283 祝
- f9b5 291 マル秘
- f7b1 197 フリーダイヤル
ver 1.01c (2010/06/01)
- 大陸簡体モードで、GBの自動判定に対応。EUC-TW/GBK/GB 18030の差は認識せず、これをGB 18030として処理する。
- ISO-646-PT:1984の0x5bをU+00A3→U+00C3に修正
ver 1.01b (2010/04/26)
- Unicode入力側での異体字セレクター処理をやめ、出力側での処理に統一。
- argv[0]からカレントディレクトリを取得し、必要なファイルを読み取る場合に使用するようにした。他のディレクトリから呼び出す時に正常に動かない問題を解消。
- DLL群に、カレントディレクトリを通知するAPIを追加
- gtef.ini に、オプションの初期値を設定可能にした。書式はOSを問わずWindowsのINIファイルと同じで、[System]セクションのOption=行に必要なオプションを記述する。書式を誤るとコマンドライン時と同様、エラーとなるので注意。
- -l:zh-tw を追加し、台湾モードでの符号自動認識機能を追加。Big5とEUC-TWを認識する。日本語モードでも、明らかにBig5の場合にはBig5で処理する。但し、自動認識で設定されるBig5は通常の文字集合なので、それ以外(例えばBig5-uao等)の場合には手動設定が必要。
ver 1.01a (2010/04/09)
- IVS→互換漢字の変換で、言語による制限を付けた(暫定仕様)。日本語および言語指定のない場合は、日本語の互換漢字とSouth Koreaのうちの2文字、つまりIBM拡張漢字以外の互換漢字は吐き出さない。将来的な正規化の実装も視野に。なお、言語の手動での指定は現時点では対応していないので、実質的に余計な互換漢字を吐かないようにするための制限機構として機能する。
- 諸橋大漢和の変換表を更新。
- EUC-TWの1面の変換表と関連処理を変更。
- EUC-TWで、文字集合を選択可能とした。CNS 11643-1986、CNS 11643-1992、CNS 11643-2004、から選択可能。CCSを指定しない場合は、従来通り最新が自動的に採用される(この版からCNS 11643-2004)。
- なお、ISO-2022-CNで出力する場合も、現時点では1面の2004追加文字をそのまま出力している。将来的にこちらも対応するが、6F型エスケープシーケンス(改訂版の識別)の扱いをどうするかが仕様(RFC)上も不明瞭である。
- www.cns11643.gov.tw製でPublic Domainの変換表がある。第1字面の記号類が不完全だが、この変換表を参考にして変換表の改善をした。将来的に、他の字面の拡張にこの変換表を用いることとする。
ver 1.01 (2010/03/27)
- JIS X 0213のVS付き変換表完成。2000と2004での文字集合の差異にも対応。
- JIS C 6226、JIS X 0208:1983の変更点資料を元にJIS C 6226の実装。
- SHIFT_JIS-2004→SJISで、JIS X 0208と字形が異なる文字が出力されない問題が確認されたので、SHIFT_JIS-2004からJIS X 0208相当の出力をする処理を追加。
- IVSオプションの仕様変更(1.00d以前と互換性なし)
- -ivs:all … 全ての文字で異体字セレクターを吐く
- -ivs:auto … 互換文字を優先し、残る全ての文字で異体字セレクターを吐く
- -ivs:off … 互換文字を優先し、残る全ての文字で異体字セレクターを使わない
- -ivs:cut … -ivs:allから異体字セレクターのみを削除
デフォルトは-ivs:offとし、IVS未対応の変換ツールと共通の動作とする。
- TRONコード8面9面の処理の改良と修正
- 諸橋大漢和の変換表を更新
- 内部コード→シリアルの変換が正しくなかったため、変換表を作り直した。
- Unicode+VS内部表現形式からの変換にも対応するよう処理を追加。
- 侮(U+4FAE U+E0100)→8-2764
- 侮(U+4FAE U+E0101)→8-2765
など、動作検証。
- 優先度などもあり。例えば兔(U+5154)は、8-2F59/8-2F5Aが対応する。異体字セレクターが無い場合は後者8-2F5Aを出力するが、U+5154の後にU+E0100が来れば、この出力を取り止めて8-2F59を出力する。
- ISO/IEC 10646:2003/Amd.6:2008を確認
- 統合カナダ原住民音節文字 拡張が、FPDAM6とAmd.6およびUnicode 5.2との差異を認めたので、バージョン表を修正更新。
- U+26xxの記号類については、U+26CE、U+26E2、U+26E4‐U+26E7に差異を認めたが、既にバージョン表では対応を済ませてある。
- U+2757の記号は、FPDAM6とAmd.6およびUnicode 5.2との差異を認めたが、既にバージョン表では対応を済ませてある。
- U+2B55‐U+2B59の記号は、FPDAM6とAmd.6およびUnicode 5.2との差異を認めたが、既にバージョン表では対応を済ませてある。
- U+32FF9の記号は、FPDAM6とAmd.6およびUnicode 5.2との差異を認めたが、既にバージョン表では対応を済ませてある。
- U+AA7Bは、FPDAM6とAmd.6およびUnicode 5.2との差異を認めたが、既にバージョン表では対応を済ませてある。
- U+110BE‐U+110BFは、FPDAM6とAmd.6およびUnicode 5.2との差異を認めたが、既にバージョン表では対応を済ませてある。
- U+1F12E、U+1F14F→U+1F190は、FPDAM6とAmd.6およびUnicode 5.2との差異を認めたが、既にバージョン表では対応を済ませてある。
- U+1F2xxは、FPDAM6とAmd.6およびUnicode 5.2との差異を認めたが、既にバージョン表では対応を済ませてある。
- gtefdll.lstに、JIS X 0213 第二面の符号の対応が一部不足していたので補った。
- TRONコードのフッタ出力と、入力に対応するバッファフラッシュのタイミングが上手くあっていなかったので、APIの仕様を変更し、フッタを最後に出せるよう改良。
- 無効文字の場合、強制的に第1面に切り換えて〓を出すようにした。
- NEC選定IBM拡張文字だけでなく、IBM拡張文字も専用バンクで管理する様にし、入力と出力の符号が維持されるようにした(例:SJIS→SJIS)。SJIS以外は現時点では従来通りUnicode経由になるので、微妙な字形差で変換に失敗するものがあるかもしれない。
- UTF-7からの入力でサロゲートを2回分キャンセルするため、フラグにビットを追加。整理のためビット構成を変更した。
- ISO-2022-JP-MS出力処理の改良。
ver 1.00d (2010/03/12)
- JIS C 6226、JIS X 0208のIVSテーブルの更新。全体の2/3程度まで見直し/修正完了。
- IVS出力まわりの抜本的な修正をした。
- シフトJISの、NEC特殊文字、NEC選定IBM拡張文字の入出力
- シフトJISの、旧JISと新JISの変換処理
- EUC-JPでのNEC特殊文字の入出力。NEC選定IBM拡張文字は扱わない。
- EUCJP-OPENでのNEC特殊文字、NEC選定IBM拡張文字
- JISX0208出力で、NEC選定IBM拡張文字などの処理を削除した(必要ないはず)
- 0xFA12(IBM)/U+FA20をU+8612 U+E0101に同定、変換に対応
- 一部の変換表で0xFA1BをU+798F U+E0100としていたのを、U+E0101に修正
- eucJP-openでJIS X 0212の文字が出なくなっていたのを修正(1.00cからのエンバグ)
- eucJP-openでIBM拡張文字にもあるJIS X 0212の文字が、SJISから出力できていない問題への対応。
ver 1.00c (2010/02/15)
- EUC-JPでの出力で、JIS X 0212が出力されないバグが存在したので、出力するように修正。条件は、EUC-JP系において、G3にJIS X 0212が配置される場合のみ。
- CESが「EUC-JP」で、次の各CCS
- CCS未設定(自動)
- JIS C 6226/JIS X 0208各バージョン
- NEC98/EPSON-PC/IBM-PC
- Windows-31J/OS2のCP943/CP943C
- EUC-HJ
- ARIB STD-B24
- その他、後述する例外以外
- CESが「EUC-JISX0213-plane1」
- CESが「EUC-JIS-2004-plane1」
- CCSが次の場合は、JIS X 0212をG3に出力しない。
- JIS X 0213
- CP51932
- CP20932
- CESが次の場合は、JIS X 0212をG3に出力しない。
- eucJP-ms
- eucJP-0201
- eucJP-ascii
ver 1.00b (2010/01/28)
- NEC選定IBM拡張文字の変換表をIVS対応にした
- IBM拡張文字の変換表をIVS対応にした
- eucJP-openの拡張漢字変換表をIVS対応にした
- Shift_JISX0213やShift_JIS-2004の読み込み処理が壊れていたので修正。0.17 betaでソース分離したときにエンバグしていた。
ver 1.00a (2010/01/06)
- 諸橋大漢和で、Ext-Bに対応する文字のIVS化完了
- APLの初期設定に問題があったのを修正
- 6点点字と8点点字を選択するオプションを追加
- Braille ASCII 対応
- TADの出力で、ヘッダが消失する例があったので、変換DLLから統括宛にフラッシュ要求をするためのビットを追加した。
- TADの出力で、フッタが正常に出力されない例があったので、出力条件の調整。
- JIS C 6226:1978(78JIS)がTAD出力に入力された場合に出力できなかった問題の改良。78・83JIS変換処理を導入し、出力に対応させた。
- JIS X 0208の変換表をIVS対応にした
- ISO-2022-JP/EUC-JP/SJISの入力で、版が確実と思われるものは、内部でVSを付けるようにした。
- Windowsコードページや、TRONコードなど、どの版であるか明確でないものは、今後の調査を要するのでVSは出力しない。
- UTF-32等からIVS付きで入力された際、出力側で削除されるようにした。シフトJIS、EUC-JP、ISO-2022-JP、JIS X 0208、JIS X 0212、JEF、KEIS、MSX ANKで異体字セレクタの削除処理を追加。他の符号についても、順次対応していく予定。
- IVS対応のオプションの仕様変更
- -IVSON (旧-IVSON)
- IVSオン
- -IVSAUTO (旧-IVSOFF)
- IVS自動 (標準)
- -IVSOFF (旧-IVSCUT)
- IVS削除
-IVSAUTOは、基本的にはIVSオンと同様に異体字セレクターを出力するが、互換漢字が存在する場合は、互換漢字に変換する。但し、出力DLLが対応している場合のみ。
現在は、lng_ja.dll と、lib_unicode.dll でのみ対応する。具体的には、SJIS/EUC-JP/ISO-2022-JP系と、UTF-8/16-32で動作。
なお、入力がSJIS等の場合、自動判定ではJISの版が不明のためVSを出力しない。手動で設定する必要がある(例: -i:sjis/90)。
統括DLLに与えるenumの名称も変更されているので注意。値自体は変更がない。
- 旧
- GTEF_IVS_ON = 0,
- GTEF_IVS_OFF,
- GTEF_IVS_CUT,
- 現
- GTEF_IVS_ON = 0,
- GTEF_IVS_AUTO,
- GTEF_IVS_OFF,
ver 1.00 (2009/12/12)
- 正式版初版
- Unicode関係の符号で、CCSにUnicode 6.0を指定可能にした。FDAM7時点での追加予定文字をバージョン表に追記。
ver 0.19 beta (2009/12/10)
- -qオプション(Quietモード)が正常に機能していなかったのを修正。gtefctl APIでの値の引き渡し処理が作られていなかった。
- シフトJISの出力で、システム外字処理まわりでエンバグしていた。Unicode化する前と後で処理を分けた。
- TRONコードの8面9面、諸橋大漢和辞典の入出力に対応した。
- EBCDIC CP25 [Japan (Latin)] 対応
- EBCDIC CP26 [Japan (Latin)] 対応
- GB 18030で、GBKにおける未定義文字を、IBM-1386の変換表を使ってUnicodeに割り付けるようにした。これによってGBKにない2バイト文字のUnicodeマッピングが可能になった。
- 一般的なGBKで未定義で、その他のGBKで実装されている文字の変換表に問題があったので改善。JDK、CP936、CP1386を変更。
- TRONコードのiモード絵文字入出力および他キャリアとの変換に対応
- TRONコードの6点点字の入力、8点点字の入出力に対応。6点点字は、Unicodeの8点点字にマッピングする。このためUnicode→TRONコードでは8点点字が出力される。対策を検討中。
ver 0.18 beta (2009/12/03)
- UTF-32の処理の問題を修正。自動認識とBOMの処理まわりが噛み合っていなかった。
- 絵文字の処理で、Unicodeの規格文字を入力し、シフトJISの絵文字として出力する機能を実装。これにより、シフトJIS、Unicodeの外字、Unicodeの規格文字の全方向相互変換を実現。Unicode規格文字は入力の符号を問わない。
- シフトJIS→UTF-8外字
- シフトJIS→Unicode規格文字
- UTF-8外字→シフトJIS
- UTF-8外字→Unicode規格文字
- Unicode規格文字→シフトJIS
- Unicode規格文字→UTF-8外字
- ソフトバンク絵文字(UTF-8)の入出力が不正だったのを修正
ver 0.17 beta (2009/12/02)
- 製品名を「もじかん」に決定しました。
- gtefenc.lstの編集
- ヨーロッパ系符号を整理整頓し、言語グループごとに分離。
- フランス語も、本国系と、カナダ系(fr-ca)で分離
- EBCDICで、各コードページごとにCES-IDとCCS-IDを振っていたのを中止。CES-IDはEBCDICに対し一つとし、CCS-IDでコードページを区別するよう仕様変更。
- EBCDIC CP6 [Latin America (Puerto Rico, Costa Rica)] 対応
- EBCDIC CP7 [Germany F.R./Austria] 対応
- EBCDIC CP8 [Germany F.R.] 対応
- EBCDIC CP9 [France, Belgium] 対応
- EBCDIC CP10 [Canada (English)] 対応
- EBCDIC CP11 [Canada (French)] 対応
- EBCDIC CP12 [Italy] 対応
- EBCDIC CP13 [Netherlands] 対応
- EBCDIC CP15 [Switzerland (French)] 対応
- EBCDIC CP16 [Switzerland (French/German)] 対応
- EBCDIC CP17 [Switzerland (German)] 対応
- EBCDIC CP18 [Sweden/Finland] 対応
- EBCDIC CP19 [Sweden/Finland WP, Version 2] 対応
- EBCDIC CP20 [Denmark/Norway] 対応
- EBCDIC CP21 [Brazil] 対応
- EBCDIC CP22 [Portugal] 対応
- EBCDIC CP23 [United Kingdom] 対応
- EBCDIC CP24 [United Kingdom] 対応
- HKSCS-2004の入力で8740-8779に対応できていなかった問題を修正。
- HKSCSで、F9DD-F9FEを微調整。f9ddを罫線とし、f9feをU+FFEDに対応づけた。
- HKSCS-2004以降での追加文字対応。HKSCSを指定したときに自動で指定される文字集合を、最新のHKSCS-2004+200809に変更した。
- HKSCS-2004+200611
- HKSCS-2004+200802
- HKSCS-2004+200809
- ソース1 http://www.ogcio.gov.hk/ccli/unicode/hkscs/download/newchar.pdf
- ソース2 http://appsrv.cse.cuhk.edu.hk/~irg/irg/irg33/IRGN1639HKSCS.txt
- シフトJISの処理をソース分離、処理の改善
- CP942/CP943(シフトJIS)のC0入れ換えが機能していなかったのを修正
- MSX漢字集合に対応。汎用、汎用(第一水準)、パナ、パナ(第一水準)、ソニー、ソニー(第一水準)、三洋(第一水準)、MSXPLAYer、に対応。
ver 0.16 beta (2009/11/26)
- gtefenc.lstの記述ミスの修正
- gtefwin_compactをケータイ絵文字に対応
- gtefwin_compactをアーカイブから分離
ver 0.15 beta (2009/11/20)
- J-PHONE/Vodafone/ソフトバンクモバイルの絵文字対応(2G、3G)
- 2Gはエスケープ付きの入出力
- 3GはシフトJIS外字での出力。入力は、外字と、2Gと同じエスケープ付きの両方に対応。
- モバイルで、シフトJISで読ませてUTF-8で規格文字出力させる機能を有効化
- CP50220/CP50221/CP50222で、漢字で終わるとエスケープシーケンスが大量に出てしまう問題を修正
- ISO-IR-55(ISO-5428)変換表の見直し
- シンボル回りのCCS-IDの仕様変更
- ISO-IR-99に新規対応
- ISO-IR-31に新規対応(暫定)
- MSX(ANK)に新規対応
ver 0.14 beta (2009/11/12)
- NTTドコモ、イーモバイル、ウィルコム、auの絵文字対応
- シフトJISでの入出力、UTF-8での入出力
- 但し、UTF-8からの入力はPUA領域のみ。FPDAM8のUnicode符号の入力を入力して、シフトJISないしUTF-8のPUAで出力する機能は未対応。
ver 0.13 beta (2009/10/29)
- LinuxのUbuntu用バイナリの提供を開始。
- 改行をはじめとしたオプション類がうまくDLLに渡っていなかったので修正。0.07で仕様を変更してからのエンバグ
- WINDOWS-20106(CP20106) を ISO-646-DE の別名として登録
- WINDOWS-20107(CP20107) を ISO-646-SE2 の別名として登録
- WINDOWS-20108(CP20108) を ISO-646-NO2 の別名として登録
- IBM-243(CP00243)に新規対応 (ギリシャ語として)
- WINDOWS-20423(CP20423) に新規対応
- IBM-290(CP00290)に新規対応 (日本語語として)
- WINDOWS-20290(CP20290)に新規対応 (IBM-290からユーロ記号が足りない)
- IBM-833(CP00833)に新規対応 (朝鮮語語として)。別名としてWindows-20833も登録
- IBM-880(CP00880)に新規対応 (キリル言語)
- WINDOWS-20880(CP20880) に新規対応
- IBM-905(CP00905)に新規対応 (トルコ語)
- WINDOWS-20905(CP20905) に新規対応
- IBM-924(CP00924)に新規対応。別名としてWindows-20924も登録
- WINDOWS-20932(CP20932) に新規対応
- IBM-1027(CP01027)に新規対応。
- WINDOWS-21027(CP21027) に新規対応
- Wingdings に新規対応
- Wingdings-2 に新規対応
- Wingdings-3 に新規対応
ver 0.12 beta (2009/10/23)
- ISO-IR-38 (DIN 31624)の入出力に新規対応
- ISO-IR-53 (ISO 5426)の入出力に新規対応
- ISO-IR-59 (アラビア語)の入出力に新規暫定対応
- IBM-5104 (ウルドゥー語)の入出力に新規対応
- CP1098のCES-IDをウルドゥー語からペルシャ語に付け替えた
- ASMO-708 (アラビア語)の入出力に新規対応。従来、ISO-8859-6の別名としていたが、Windows XPの実装に変換表を合わせた。
- DOS-720 (アラビア語)の入出力に新規対応
- CNS 11643-3の変換表を作り直す。
- CNS 11643-3/4/5/6/7/12/13/14の入出力処理を作成。3/4/5/6/7については、ISO-2022-CN-EXTと、EUC-TWでの入出力対応。12/13/14については、EUC-TWでの入出力対応
- DEC-HANYUの4文字シーケンス処理がエンバグしていたので修正。また参照するテーブルが3/4/5/6/7共存になったので、3のみ出力するように改修
- CP1200をUTF-16LEの別名として登録した(CCS設定は未対応)
- CP1201をUTF-16BEの別名として登録した(CCS設定は未対応)
- CP12000をUTF-32LEの別名として登録した(CCS設定は未対応)
- CP12001をUTF-32BEの別名として登録した(CCS設定は未対応)
- CP20273、20277、20278、20280、20284、20285、20297、20420、20424、20838、20871、21025 を、20000減じたIBM EBCDICのコードページの別名として登録した(Windowsコードページ)
- WINDOWS-20866(CP20866)を、KOI8-Rの別名として登録した(EBCDICの00866ではない)。
- WINDOWS-20949(CP20949)(朝鮮語)に新規対応(EUC-KRの派生)
- WINDOWS-51949(CP51949)(朝鮮語)に新規対応(WINDOWS-20949と全く同じ)
- EUC-KRからの入力で、追加文字はCCSに応じて無効化した(出力は対応済み)
- WINDOWS-50225(CP50225)を、ISO-2022-KRの別名として登録(暫定)
- WINDOWS-50227(CP50227)を、ISO-2022-CN/GBの別名として登録(暫定)
- WINDOWS-51936(CP51936)を、EUC-CNの別名として登録(暫定)
- WINDOWS-52936(CP52936)を、HZの別名として登録(暫定)
- WINDOWS-54936(CP54936)を、GB18030の別名として登録(暫定)
- WINDOWS-57002(CP57002)を、ISCII-DEVANAGARIの別名として登録
- WINDOWS-57003(CP57003)を、ISCII-BENGALIの別名として登録
- WINDOWS-57004(CP57004)を、ISCII-TAMILの別名として登録
- WINDOWS-57005(CP57005)を、ISCII-TELUGUの別名として登録
- WINDOWS-57006(CP57006)を、ISCII-ASSAMESEの別名として登録
- WINDOWS-57007(CP57007)を、ISCII-ORIYAの別名として登録
- WINDOWS-57008(CP57008)を、ISCII-KANNADAの別名として登録
- WINDOWS-57009(CP57009)を、ISCII-MALAYALAMの別名として登録
- WINDOWS-57010(CP57010)を、ISCII-GUJARATIの別名として登録
- WINDOWS-57011(CP57011)を、ISCII-PUNJABIの別名として登録
- WINDOWS-65000(CP65000)を、UTF-7の別名として登録
- WINDOWS-65001(CP65001)を、UTF-8の別名として登録
- WINDOWS-28598(CP28598)に対応(ISO-8859-8の派生)
- IBM-916対応(ISO-8859-8の派生)
- ISO-8859-8-i、CP38598に暫定対応(処理内容は、ISO-8859-8-iやCP28598と同じ)
- WindowsのMac文字集合対応関係の更新
- MacRoman と CP10000 の変換表を分離
- WINDOWS-10002(CP10002)に対応(Big5の一種)
- MACCHINESETRADに対応。MACCHINESETRADの処理は、unicode.orgにあるような外字を使った特殊な変換に対応
- CP10003(朝鮮語)に新規対応(EUC-KRの派生)
- MacKorean(朝鮮語)に新規対応(EUC-KRの派生)
- WINDOWS-10004(CP10004)、MacArabicの変換表を、Windows XP相当に変更。
- WINDOWS-10005(CP10005)、MacHebrewの変換表を、JDK相当に変更。2000やXPではまた若干違うようだ。
- MacGreek と CP10006 の変換を分離
- MacCyrillic と CP10007 の変換を分離
- MACCHINESESIMP と CP10008 の変換を分離。MACCHINESESIMPの処理は、unicode.orgにあるような外字を使った特殊な変換に対応
- MacRomanian と CP10010 の変換を分離
- MacUkrainian と CP10017 の変換を分離
- MacThaiを、MacThai、MacThai/JDK、CP10021/W2K、CP10021/XP、の四種類に分割
- IBM-1282を、MacCentralEuropeの別名として登録。unicoee/win/jdkで共通であることを確認。
- MacIceland と CP10079 の変換を分離
- MacTurkish と CP10081 の変換を分離
- MacCroatian と CP10082 の変換を分離
- ISO-IR-169 Blissymbolに暫定対応。但し、一部の文字を除き他の文字集合に変換できる文字がない。
- CP20000(台湾正体)に新規対応(EUC-TWの拡張)
- CP20001(台湾正体)に新規対応(UHC風の独自符号)
- CP20002(台湾正体)に新規対応(UHC風の独自符号)
- CP20003(台湾正体)に新規対応(シフトJIS風の独自符号)
- CP20004(台湾正体)に新規対応
- CP20005(台湾正体)に新規対応
- CNS11643 1面変換表の2126=0x30fbを、0x2027に変更。
- CP20105に対応
- T.61-8BITに対応(2バイト文字にも対応)
- T.101-G2に対応(2バイト文字にも対応)
- CP20261に対応(2バイト文字にも対応)
- CP20269に対応
ver 0.11 beta (2009/10/14)
- DEC-HANYUで、4文字シーケンス中の3文字目と4文字目がGLの場合は未定義文字扱いとした
- DEC HANZIの入出力に対応。
- DEC 漢字 2000に対応。
- Javaの符号との互換性に配慮開始
- UNICODEBIG を、UCS-2BE から、UTF-16 の別名に変更(Java互換)。
- UNICODEBIGUNMARKED を、UTF-16BE の別名として登録(Java互換)。
- UNICODELITTLE を、UCS-2LE から、UTF-16-BOMLE の別名に変更(Java互換)。
- UNICODELITTLEUNMARKED を、UTF-16LE の別名として登録(Java互換)。
- IBM-273(CP00273)に新規対応 (ドイツ語として)
- IBM-277(CP00277)に新規対応 (デンマーク語として)
- IBM-278(CP00278)に新規対応 (フィン語として)
- IBM-280(CP00280)に新規対応 (イタリア語として)
- IBM-284(CP00284)に新規対応 (スペイン語として)
- IBM-285(CP00285)に新規対応 (英語として)
- IBM-297(CP00297)に新規対応 (フランス語として)
- IBM-420(CP00420)に新規対応 (アラビア語として)
- IBM-424(CP00424)に新規対応 (ヘブライ語として)
- IBM-838(CP00838)に新規対応 (タイ語として)
- IBM-868(CP00868)に新規対応 (ウルドゥー語として)
- IBM-870(CP00870)に新規対応 (Latin-2)
- IBM-871(CP00871)に新規対応 (アイスランド語として)
- IBM-875(CP00875)に新規対応 (ギリシャ語として)
- IBM-918(CP00918)に新規対応 (ウルドゥー語として)
- IBM-1006(CP01006)に新規対応 (ウルドゥー語として)
- IBM-1025(CP01025)に新規対応 (キリール文字)
- IBM-1026(CP01026)に新規対応 (トルコ語として)
- IBM-1097(CP01097)に新規対応 (ペルシャ語として)
- IBM-1098(CP01098)に新規対応 (ペルシャ語として)
- IBM-1112(CP01112)に新規対応 (ラトビア、リトアニア)
- IBM-1122(CP01122)に新規対応 (エストニア語として)
- IBM-1123(CP01123)に新規対応 (ウクライナ語として)
- IBM-1141(CP01140)に新規対応
- IBM-1141(CP01141)に新規対応 (ドイツ語として)
- IBM-1142(CP01142)に新規対応 (デンマーク語として)
- IBM-1143(CP01143)に新規対応 (フィンランド語として)
- IBM-1144(CP01144)に新規対応 (イタリア語として)
- IBM-1145(CP01145)に新規対応 (スペイン語として)
- IBM-1146(CP01146)に新規対応 (英国英語として)
- IBM-1147(CP01147)に新規対応 (フランス語として)
- IBM-1148(CP01148)に新規対応
- IBM-1149(CP01149)に新規対応 (アイスランド語として)
- 北朝鮮KPS 9566-97(EUC-KP、ISO-2022-KP)対応
- 北朝鮮KPS 9566-2003対応
- 大陸簡体 EUC-CNの派生IBM-5478に新規対応
- 大陸簡体 EUC-CNの派生CP1381に新規対応
- 大陸簡体 EUC-CNの派生CP1383に新規対応
- 大陸簡体 GBK の仕様を変更し、文字集合を複数に分離した。
- 純粋なGBK(外字無し)
- CP936 (Windowsの実装、外字あり、0x80ユーロ記号あり)
- JDK (Javaの実装、外字あり、但しWindowsと外字の割り当て位置が若干異なる)
- IBM-1386
- CP10008とCP20936に対応(同じ仕様)
- SHIFTGBに新規対応(文字集合は純粋なGB 1988-80)
- Mac OS (osaka) シフトJISの入出力対応。unicode.orgにあるように、外字に特殊な意味を定義して用いている。Unicodeへの出力、またUnicodeからMac OSシフトJIS出力で、この外字解析に対応した。
- EUC-JP系のCP954とCP33722に新規対応。
- CP932に、非互換の複数の変換表があるため、処理を考慮した。
- MS932
MS932の0x80、0xa0、0xfd、0xfe、0xffを、Windowsの変換表に合わせた。
0x80以外は外字。
MS932、CP932、CP932/WINなどで指定する。
- IBM-932 (DOS/V)
実物は未確認ながら、JIS C 6226 + IBM拡張漢字、とされているので、そのように実装(従来通り)。但し指定名については若干仕様変更。
CP932/IBM、CP932/DOSV、IBM-932などで指定する。
- IBM-932 (OS/2)
JIS C 6226の文字並びにJIS X 0208-1983の追加文字を含む、とされているので、そのように実装した。
内部的にはJIS X 0208で扱うので、従来のJIS C 6226用新旧変換表を拡張した。
CP932/OS2、IBM-932/OS2などで指定する。
- IBM拡張漢字とUnicodeの変換表を、シフトJISベースからJISベースに変更した
- IBM-942、IBM-942C対応
- IBM-943、IBM-943C対応
- CP10001 (WindowsのMacJapanese) 対応
- インド諸語用のISCIIの入出力に対応
- Unicode→GB2312の変換表を圧縮
- GB18030→Unicode変換表を廃止し、大幅に縮小(77Kiバイト程度)
ver 0.10 beta (2009/09/30)
- CCS-IDの仕様変更。コードページ番号を当初設計通りに分離
- CP856・IBM-856に新規対応(ヘブライ語として)
- 同名で3種類の非互換の文字集合がある
- CP856 iconv互換
- CP856/JDK jdk集合 (iconvと比較し、0xEE、0xFAが異なる)
- CP856/IBM IBM-856 (iconvと比較し、0x1A、0x1C、0x7F、0xEE、0xFAが異なる)
- CP856は、IBM-856の別名でも登録。
- CP922・IBM-922に新規対応(エストニア語として)
- 同名で2種類の非互換の文字集合がある
- CP922/AIX CP922/DOS iconv v1互換、AIX、DOS
- CP922 iconv v2互換
- IBM-902に新規対応(エストニア語として)
- IBM-1131をロシア語派生管轄から、ベラルーシ語符号に変更(CES-ID、CCS-IDも変更)
- IBM-849に新規対応(ベラルーシ語として)
- シフトJISとして、CP943、CP943Cに対応し、各種出力仕様暫定変更。参考資料
-  ̄ (1-17 OVERLINE) を、U+203E から U+FFE3 にマッピングを変更
- ~ (1-33 WAVE DASH) を、U+301C から U+FF5E にマッピングを変更(MS932のみ)
- ∥ (1-34 DOUBLE VERTICAL LINE) を、U+2225 から U+2016 にマッピングを変更(MS932以外)
- - (1-61 MINUS SIGN) を、U+2212 から U+FF0D にマッピングを変更(MS932のみ)
- ¢ (1-81 CENT SIGN) を、U+00A2 から U+FFE0 にマッピングを変更(MS932のみ)
- £ (1-82 POUND SIGN) を、U+00A3 から U+FFE1 にマッピングを変更(MS932のみ)
- ¬ (2-44 NOT SIGN) を、U+00AC から U+FFE2 にマッピングを変更(MS932のみ)
- U+203E→U+FFE3、U+2225→U+2016は、JIS X 0208の変換表自体を変更し、それ以外は処理にて対応した。変換表を変更した文字は他の符号(ISO-2022-JP、EUC-JP等)にも影響する。対応は、シフトJISの入力、EUC-JP/WINの入力、ISO-2022-JP/WINの入力に対応。出力はどちらからでも出力する(従来通りの仕様)
- 日本語で、U+22EF→0x2144(JIS)「…」に変換するようにした(古いMacTECで、…をU+22EFで出力していたとのことから)。
- IBM-1046に新規対応(アラビア語として) glibc-2.2-iconv相当。libiconv-1.6ではない。
- IBM-1124に新規対応(ウクライナ語として)
- IBM-1161に新規対応(タイ語として)
- IBM-1162をISO-8859-11の別名として登録(タイ語)
- CP853に新規対応
- IBM-864(アラビア語)の変換表の改良。基本に加えて、Windows 2000とWindows XPの変換表を用意した。
- IBM-869(ギリシャ語)の0x80から0x9fが正常に処理できていなかったので修正
- IBM-1125(ウクライナ語)に新規対応
- ATARI STに新規対応
- RISCOS-LATIN1に新規対応
- EUC-HJで、G0、G2、G3が表示されていなかったのでgtefenc.lstに情報を書き足した
- DEC-KANJIへの暫定対応
- 「JIS」系符号の仕様変更。ISO-2022-JPの別名定義ではなく、独自の符号処理を行なうようにした。
- JISC6226 および別名
- JISX0208-1983 および別名
- JISX0208:1990 および別名
- JIS/98 および別名
- JIS/IBM および別名
- JIS/EPSON および別名
- JIS/AX および別名
- JISX0212 および別名
- 「GB-2312」系符号の仕様変更。EUC-CNの別名定義ではなく、独自の符号処理を行なうようにした。
- ISO/IEC 2022まわりの改良、修正
- 簡体中文に関する処理の大幅な改良と修正。
- 変換表を作り直し、GB 2312→Unicode、GBK→Unicode、Unicode→GB 2312/GBKとして全体的に処理を見直した。
- ISO-2022-CN-EXTとしてISO-IR-165の入力に暫定対応。出力は指定名含めて今後の検討課題とする。
- Unicode置換可能な文字のみ対応。半角ピンインや、Unicodeに無さそうなパターンについては今後の対応予定。
- ISO-IR-165として、入出力に対応。
- 香港のBIG5-HKSCS:2004の入出力に新規対応
- ISO-2022-CN-EXTおよびEUC-TWとして、CNS 11643-3の入出力に対応。2022でCNSを優先的に出力する場合は、ISO-2022-CN-EXT/CNS11643(略記別名あり)のようにCCSとしてCNSを指定する。
- DEC-HANYUの入出力に対応
ver 0.09 beta (2009/09/18)
- UCS-2とUCS-4の仕様を変更
- UTF-16、UTF-32と同様に、BE/LE/BOM+BE/BOM+LEの選択を可能とした
- UNICODE-1-1、UNICODEBIG、CSUNICODE11は、UCS-2BEの別名として登録
- UNICODELITTLEは、UCS-2LEの別名として登録。
- また、UTFの場合と同様にCCSを選択可能。但しCES名がUCS-2BEかUCS2BE、UCS-4BEかUCS4BEの場合のみ。
- iconvにある C99 と JAVAの入出力対応
- ASCIIはそのまま。原文中に含まれる \ もそのままスルーする
- C99は、U+100からU+FFFDまでは \u**** 形式
- C99は、U+10000以上は \U******** 形式
- JAVAは、全てを \u**** 形式する。サロゲートペアは \ud8**\udc** のような形式
- 符号名のゆらぎ対応
- CP819、IBM819、ISO8859-1、ISO_8859-1:1987、L1、LATIN1、CSISOLATIN1をISO-8859-1の別名として登録
- ISO8859-2、 ISO_8859-2:1987、L2、LATIN2、CSISOLATIN2をISO-8859-2の別名として登録
- ISO8859-3、ISO_8859-3:1988、L3、LATIN3、CSISOLATIN3をISO-8859-3の別名として登録
- ISO8859-4、ISO_8859-4:1988 L4 LATIN4 CSISOLATIN4をISO-8859-4の別名として登録
- ISO8859-5、CSISOLATINCYRILLICをISO-8859-5の別名として登録
- ARABIC、ASMO-708、ECMA-114、ISO-IR-127、ISO8859-6、ISO_8859-6、ISO_8859-6:1987、CSISOLATINARABICをISO-8859-6の別名として登録
- ECMA-118、ELOT_928、ELOT-928をISO-8859-7:1987の別名として登録
- GREEK、GREEK8、CSISOLATINGREEKをISO-8859-7の別名として登録
- HEBREW、ISO_8859-8、ISO8859-8、CSISOLATINHEBREWをISO-8859-8の別名として登録
- ISO_8859-8:1988をISO-8859-8:1988の別名として登録
- ISO8859-9、ISO_8859-9、ISO_8859-9:1989、L5、LATIN5、CSISOLATIN5をISO-8859-9の別名として登録
- ISO8859-10、ISO_8859-10:1992、L6、LATIN6、CSISOLATIN6をISO-8859-10の別名として登録
- ISO8859-11、ISO_8859-11をISO-8859-11の別名として登録
- ISO8859-13、L7、LATIN7をISO-8859-13の別名として登録
- ISO-CELTIC、ISO8859-14、ISO_8859-14:1998、L8、LATIN8をISO-8859-14の別名として登録
- ISO8859-15、ISO_8859-15:1998をISO-8859-15の別名として登録
- ISO8859-16、ISO_8859-16、ISO_8859-16:2001、L10、LATIN10をISO-8859-16の別名として登録
- CSKOI8RをKOI8-Rの別名として登録
- MS-EEをWINDOWS-1250(CP1250)の別名として登録
- MS-CYRLをWINDOWS-1251(CP1251)の別名として登録
- MS-ANSIをWINDOWS-1252(CP1252)の別名として登録
- MS-GREEKをWINDOWS-1253(CP1253)の別名として登録
- MS-TURKをWINDOWS-1254(CP1254)の別名として登録
- MS-HEBRをWINDOWS-1255(CP1255)の別名として登録
- MS-ARABをWINDOWS-1256(CP1256)の別名として登録
- WINBALTRIMをWINDOWS-1257(CP1257)の別名として登録
- CSPC850MULTILINGUALをIBM-850の別名として登録
- CSPC862LATINHEBREWをIBM-862の別名として登録
- CSIBM866をIBM-866の別名として登録
- MAC、MACINTOSH、CSMACINTOSHをMACROMANの別名として登録
- MACCEをMACCENTRALEUROPEと改名
- MACICELANDICをMACICELANDと改名
- MACROMANIAをMACROMANIANの別名として登録
- MACUKRAINEをMACUKRAINIANの別名として登録
- ISO646-JP、JIS_C6220-1969-RO、JP、CSISO14JISC6220ROをISO-646-JPの別名として登録
- KOI8-RUに新規対応(ロシア語として)
- IBM-1131に新規対応(ロシア語として)
- KOI8-Tに新規対応(ロシア語として)
- KOI8-Cに新規対応(XFree86の実装、ロシア語として)
- MacCyrillicが動作していなかったのを修正(リストのCES-IDを実装に合わせる)
- KZ-1048に新規対応(カザフ語として)
- IBM-1051、H-P Emulation, Roman 8に新規対応
- NEXTSTEPに新規対応
- GEOSTD8の表参照がずれていたので修正
- GEORGIAN-ACADEMY、GEORGIAN-PSに新規対応(グルジア語として)
- ARMSCII-8を改良し、Unicodeに無い文字(eternity sign)と重複する文字の管理を改善した。
- ARMSCII-7に新規対応(アルメニア語として)
- ARMSCII-8aに新規対応(アルメニア語として)
- MULELAO-1に新規対応(ラーオ語として)
- CP1133に新規対応(ラーオ語として)
- タイ語のTIS620-0をTIS620の別名とした(適切かどうかは定かではない)。
- タイ語のTIS620-1をWINDOWS-874(CP874)の別名とした(適切かどうかは定かではない)。
- タイ語のTIS620-2に新規対応
- CSVISCIIをVISCII/1.1の別名として登録
- VSCII-1に新規対応
- JIS X 0201を手動設定可能にした(暫定)。出力での半角・全角変換は未実装。
- JIS_X0212および関連符号名を、ISO-2022-JP-1の別名として登録した(暫定)。
- gtefenc.lstに書かれたEUC-KR/1997、EUC-KR/1998、EUC-KR/2002など、CCS指定付きの朝鮮語符号のIDが間違っていたので修正
- KS X 1001で、A2E6/A2E7A2E8に記号追加。KS X 1001:1998での2文字、KS X 1001:2002での1文字対応し、各集合のバージョンごとの変換処理を実装。
ver 0.08 beta (2009/09/15)
- Unicode 5.2ドラフトの現状と、unicode5.2文字集合対応表を適合させた。次のファイルを参考文献とする
- 5.1.0-5.2.0.all.changes.diffs 28-Aug-2009 21:47
- EastAsianWidth-5.2.0d5.txt 09-Jun-2009 19:49
- 次の範囲をUnicode 5.2の範囲から除外した(ドラフト段階で定義されていないため)
- U+18F6~U+18FC
- U+26CE
- U+26E2
- U+26E4~U+26E7
- U+32FF
- U+1F14F
- 次の範囲をUnicode 5.2の範囲に追加した(ドラフト段階で定義されているため)
- U+2757
- U+2B55~U+2B59
- U+9FC7~U+9FCB
- U+AA7B
- U+110BE~U+110BF
- U+1F12E
- U+1F190
- U+1F231
- U+2A700~U+2B73F
- ARIB STD-B24関係の文字管理でエンバグしていたので修正
- ライセンス認証機能テスト版搭載
- EBCDIC CP2 [USA (00002)] 対応
- EBCDIC CP3 [USA, Accounting, Version A (00003)] 対応
- EBCDIC CP4 [United States (00004)] 対応
- EBCDIC CP5 [United States (00005)] 対応
- gtefwin_compactに公式ページを表示する機能追加
- CodePage 1004 (OS/2 LATIN1)の変換表を改訂。空き領域に追加されたと見られる文字を削除して基本的な集合に変更した。
- 既存全EBCDICの0xffを、Unicode系の0x9f(APC)と対応づけた。入力は対応済み、出力は変換表側で対応
- EBCDICの処理のDLLを独立させた(lib_ebcdic.dll)
- ANSI_X3.4-1968、ANSI_X3.4-1986、CSASCII、USを、ASCIIの別名として登録(暫定)
- ISO_646.IRV:1991 を ISO-646の別名として登録(暫定)
- UCS2をUCS-2に変更
- UCS4をUCS-4に変更
- ISO-10646-UCS-2、CSUNICODEをUCS-2の別名として登録(CCS指定は未対応)
- ISO-10646-UCS-4、CSUCS4をUCS-4の別名として登録(CCS指定は未対応)
- UTF-16とUTF-32のCES-IDを仕様変更
- ASMO_449、ISO_9036、ARABIC7、CSISO89ASMO449 を ASMO449の別名として登録
- gtef.exeでgtef.dllのバージョンチェックをするようにした。
ver 0.07 beta (2009/09/07)
- UTF-EBCDICの入出力に対応
- EBCDIC CP37 [USA/Canada - CECP (00037)] 対応
- EBCDIC CP500 [International #5 (00500)] 対応
- EBCDIC CP1047 [Latin 1/Open Systems (01047)] 対応
- gtef.dll の仕様変更、iconv.h の仕様に似せた。これに伴い、各変換DLLの仕様も変更になった。各変換DLLの LibAnalyzeOpt は、オプション文字列を与える仕様から、あらかじめ情報を登録したstructを渡す方式に変更。
- gtefwin_compactを、gtef.dll の仕様変更に対応させた。
- 朝鮮語符号(EUC-KR、UHC、JOHAB)の出力時に改行が出力されていなかったバグを修正
- 朝鮮語符号JOHABのKS X 1001部分の出力が不正だったバグを修正
- 0xab 0xe5 を EUC-JP-2004 として読み込ませ、UTF-8やUTF-16などとして出力すると不正なメモリアクセスが発生するバグの修正。IVS→互換漢字変換処理のテーブル参照ループの終了条件設定に問題があった。
- gtefenc.lst に記述している KOI8-U のCCS番号を 10004c21 から d000556a に修正してKOI8-Uの変換が動作するように修正。
ver 0.06 beta (2009/08/28)
- gtefdll.lstの第三項目のDLL名から、拡張子を削除。Windows/UNIXで共通化
- UTF-7の入出力に対応。CCSは標準では最新のUnicodeで、以下の二種類のCCSを設定可能
- Unicode 1.1 (UTF-7/UNICODE1.1 または UNICODE-1-1-UTF-7)
- Unicode 2.0 (UTF-7/UNICODE2.0 または UNICODE-2-0-UTF-7)
- GBK出力時、改行出力禁止の有効
- UTF-7対応のため、DLLインターフェイスの仕様変更(拡張)
- ENCSPEC構造体にフラグ2件(G0固定参照フラグ、終了処理フラグ)追加
- CODEINFO構造体のフラグ領域に1件(終了処理フラグ)追加
- IOBUF構造体のフラグ1の仕様変更(CRLF出力待機フラグ)追加
- 終了処理の追加(gtef.dll)
- UTF-1対応
- 無効オプションを入力した場合、無視せず、エラー扱いとした(変換DLLが認識するオプションはgtef.dllでは判断できないので、大雑把に認識して許容する。ここにエラーがあっても判断しない)
- PC-9801の2バイト半角文字(英数カナのみ、罫線除く)を専用バンク処理。未対応の符号では相当する通常文字に変換される
- シフトJISにおいて、AX文字集合に対応。参考文献 http://apex.wind.co.jp/tetsuro/izonmoji/ax.html
- シフトJISにおいて、IBMPC文字集合または98文字集合(旧JIS)で、堯槇遙瑤の4字を除外できていなかったのを修正。
- 内部処理で使う初期バンク(ISO_START)に対してオプション設定処理を呼び出していなかったのを修正(ISO-2022-JP等で -JA:ZEN などが有効になっていなかった)
- ISO-2022-JP、EUC-JPで、98罫線類が読み込めていなかった問題を修正
ver 0.05 beta (2009/08/19)
- FreeBSD/i386 対応開始
- gtefenc.lstに、GL等で使われているASCIIの書き足し
- 試用中の処理可能サイズのカウント処理修正、約1000バイトから約2000バイトに倍増
ver 0.04 beta (2009/08/11)
- -ver オプションで、gtef.dll のバージョンも出すようにした。
- 大陸簡体で、符号 HZ に対応した
- エンコードチェックで、HZの自動認識対応
- gtefwin_compact 0.4(beta)
- バージョン番号をコマンドライン用と合わせた
- HZ対応
- Opera 9の対応符号の網羅
- VISCII/1.1対応
- US-ASCII対応
- 北欧 Windows-Sami-2対応
- 自動判別で、言語選択機能の対応準備 (現在は日本語のみ)
ver 0.03 beta (2009/08/07)
- 符号認識処理の改善と修正
- キャッシュするサイズとそれ以降の分断による誤動作を解消
- キャッシュ境界から外れた時に符号エラーとした処理を辞めた。
- EUC-JP認識部分で、減算しすぎてアンダーフローしていたので修正
- 0x8f x y のシーケンスがEUC-JPとして自動認識できていなかった問題を修正
- 1バイト目が0xfd/fe/ffの場合、SJISと認識しないようにした。
- 2バイト目が0xfd/fe/ff、0x00から0x3f、0x7fの場合、SJISと認識しないようにした。
- その他
- 試用中の処理可能サイズを、約1000バイトから約2000バイトに倍増
- gtefwin_compact
ver 0.02d beta (2009/07/21)
- 0.02cの認証が正常に機能していないようだったので再ビルドした。
- 機能面では特に変更はありません。期限を8月末に延長しました。
ver 0.02c beta (2009/07/02)
- 特に変更はありません。期限を7月末に延長しました。
ver 0.02b beta (2009/06/01)
- 特に変更はありません。期限を6月末に延長しました。
ver 0.02a beta (2009/05/01)
- 特に変更はありません。期限を5月末に延長しました。
ver 0.02 beta (2009/03/31)
gtef.exe
- -q オプションを追加(Quiet mode)
- IVSへの対応のために、構造体の初期化まわり、DLLの認証まわりを若干修正
- 画面表示にIVSモードを追加
lib_unicode.dll
- ISO/IEC 10646:2003/Amd.6:2008のFinal Proposed Draftにある文字をUnicode 5.2として登録した
- COMBINING CYRILLIC(U+2DE0-2DFF)を誤って4.1としていたものを、5.1に訂正した
- PHAGS-PA(U+A840-A87F)を誤って4.1としていたものを、5.0に訂正した
- U+1Dxxのバージョン表がおかしかったので訂正した
- 互換漢字とIVSの対応表で、JIS X 0213(U+FA30~U+FA6A)を追加した。また北朝鮮の文字でも、Adobe-Japan1で解決できたものを一部追加。
lng_ja.dll
- ARIB追加漢字で、Amd.5で追加された9fc4、9fc5、9fc6の対応を追加。
- ARIB追加漢字の変換表のうち、追加漢字部分をIVS対応とした。
全変換DLL
- IVSに関する情報を持ち回せるように仕様変更
- CODEINFO構造体を仕様変更
- IVS対応のオプション追加
- -IVSON
- IVSオン
- -IVSOFF
- IVSオフ (標準)
- -IVSCUT
- IVS削除
-IVSOFFは、互換漢字に変換する。但し、出力DLLが対応している場合のみ。
現在は、lng_ja.dll と、lib_unicode.dll でのみ対応する。具体的には、SJIS/EUC-JP/ISO-2022-JP系と、UTF-8/16-32で動作。
未対応のDLLでは、-IVSCUTと同等の動作をする。
ver 0.01 beta (2009/03/17)
ベータテスト初版