XMLと文字メーリングリスト メッセージ閲覧

[サイトのトップ][XMLと文字メーリングリスト メニューページ][ログイン][参加ガイド][新スレッド作成][スレッド一覧][メッセージ閲覧][メンバー登録][メンバー登録情報変更][パスワード変更][パスワードを忘れたら][メンバー登録解除][メッセージ削除][エラーで配信停止したメンバーリスト]

2001/09/20 12:03

From:"SHIBUYA Makoto" <mshibuya@est.co.jp>

[XML MOJI 01146] Re: CESU-8: 枝葉末節にこだわっても...

参照先: [XML MOJI 01145] CESU-8: 枝葉末節にこだわっても... (Masahiko Maedera <SGQ00310@nifty.ne.jp>)

> しかし、なにか、ここまでくると見苦しい気もします。
> 
> Compatibility Encoding Scheme for UTF-16: 8-Bit (CESU-8)
> 
> http://www.unicode.org/unicode/reports/tr26/
> 
> 技術的内容がないという意味で、UTF-32 を越えるものです。

これって、
「sarrogate 未対応の UTF-16 <--> UTF-8変換」
が、そのまま
「UTF-16 <--> CESU-8変換」
として生き残れる、ということになりますよね。

いろいろ書いてありますけど、結局はめんどくさい sarrogate
対応をやらないですます為の仕様ということでしょうか?

---------------------------------
イースト株式会社. (http://www.est.co.jp)
渋谷 誠 (mshibuya@est.co.jp)

このメッセージにコメントを書く

2001/09/20 14:49

From:Akira Kawamata <autumn@piedey.co.jp>

[XML MOJI 01147] Re: CESU-8: 枝葉末節にこだわっても...

参照先: [XML MOJI 01145] CESU-8: 枝葉末節にこだわっても... (Masahiko Maedera <SGQ00310@nifty.ne.jp>)

 川俣です。

 "Masahiko Maedera <SGQ00310@nifty.ne.jp>"さんは書きました:
> しかし、なにか、ここまでくると見苦しい気もします。
> 
> Compatibility Encoding Scheme for UTF-16: 8-Bit (CESU-8)
> 
> http://www.unicode.org/unicode/reports/tr26/
 プログラムの内部処理で使うものだと主張しているようですが。
 いったい、どんなプログラムで使うんだろう、と言うのが第1印象。
 最近のWindowの中身は(サロゲートの処理をするかどうかはともかく)UTF-16ベ
ースで動いてるはずで、ASCII互換にするメリットは無いし、JavaもC#もVBも、
文字列は(サロゲートの処理をするかどうかはともかく)UTF-16ベースになってる
し。
 かといって、レガシーなC/C++プログラムでも、Unicode使うって決めた時点で
UTF-8入出力が要求される可能性が大きいはずなので、そのまんま内部もUTF-8で
持てばラクチンなのに、なんで更に別のコードに変換したい?

-- 
 (株)ピーデー 川俣 晶 (http://www.autumn.org/ mailto:autumn@piedey.co.jp)

このメッセージにコメントを書く

問い合わせ先

 何か分からないことや問題が発生した場合は、本リスト板管理者の電子メールアドレス autumn@piedey.co.jp までお問い合わせください。

[XMLと文字メーリングリスト メニューページ][スレッド一覧][メッセージ閲覧][サイトのトップ]


List-Tei Iconりすと亭 (List-Tei 4.25.0) Copyright (c) 1997-2006 by Pie Dey Co.,Ltd.