XMLと文字メーリングリスト メッセージ閲覧

[サイトのトップ][XMLと文字メーリングリスト メニューページ][ログイン][参加ガイド][新スレッド作成][スレッド一覧][メッセージ閲覧][メンバー登録][メンバー登録情報変更][パスワード変更][パスワードを忘れたら][メンバー登録解除][メッセージ削除][エラーで配信停止したメンバーリスト]

メッセージスレッド: CESU-8: 枝葉末節にこだわっても...

2001/09/20 04:12

From:Masahiko Maedera <SGQ00310@nifty.ne.jp>

[XML MOJI 01145] CESU-8: 枝葉末節にこだわっても...

たしかに、プログラマーたるもの自分の専門分野に関してだけは、
なるべく変更の影響が少なく一貫性が取れる手段をとりたいものです。

しかし、なにか、ここまでくると見苦しい気もします。

Compatibility Encoding Scheme for UTF-16: 8-Bit (CESU-8)

http://www.unicode.org/unicode/reports/tr26/

技術的内容がないという意味で、UTF-32 を越えるものです。

このメッセージにコメントを書く

2001/09/20 12:03

From:"SHIBUYA Makoto" <mshibuya@est.co.jp>

[XML MOJI 01146] Re: CESU-8: 枝葉末節にこだわっても...

参照先: [XML MOJI 01145] CESU-8: 枝葉末節にこだわっても... (Masahiko Maedera <SGQ00310@nifty.ne.jp>)

> しかし、なにか、ここまでくると見苦しい気もします。
> 
> Compatibility Encoding Scheme for UTF-16: 8-Bit (CESU-8)
> 
> http://www.unicode.org/unicode/reports/tr26/
> 
> 技術的内容がないという意味で、UTF-32 を越えるものです。

これって、
「sarrogate 未対応の UTF-16 <--> UTF-8変換」
が、そのまま
「UTF-16 <--> CESU-8変換」
として生き残れる、ということになりますよね。

いろいろ書いてありますけど、結局はめんどくさい sarrogate
対応をやらないですます為の仕様ということでしょうか?

---------------------------------
イースト株式会社. (http://www.est.co.jp)
渋谷 誠 (mshibuya@est.co.jp)

このメッセージにコメントを書く

2001/09/20 14:49

From:Akira Kawamata <autumn@piedey.co.jp>

[XML MOJI 01147] Re: CESU-8: 枝葉末節にこだわっても...

参照先: [XML MOJI 01145] CESU-8: 枝葉末節にこだわっても... (Masahiko Maedera <SGQ00310@nifty.ne.jp>)

 川俣です。

 "Masahiko Maedera <SGQ00310@nifty.ne.jp>"さんは書きました:
> しかし、なにか、ここまでくると見苦しい気もします。
> 
> Compatibility Encoding Scheme for UTF-16: 8-Bit (CESU-8)
> 
> http://www.unicode.org/unicode/reports/tr26/
 プログラムの内部処理で使うものだと主張しているようですが。
 いったい、どんなプログラムで使うんだろう、と言うのが第1印象。
 最近のWindowの中身は(サロゲートの処理をするかどうかはともかく)UTF-16ベ
ースで動いてるはずで、ASCII互換にするメリットは無いし、JavaもC#もVBも、
文字列は(サロゲートの処理をするかどうかはともかく)UTF-16ベースになってる
し。
 かといって、レガシーなC/C++プログラムでも、Unicode使うって決めた時点で
UTF-8入出力が要求される可能性が大きいはずなので、そのまんま内部もUTF-8で
持てばラクチンなのに、なんで更に別のコードに変換したい?

-- 
 (株)ピーデー 川俣 晶 (http://www.autumn.org/ mailto:autumn@piedey.co.jp)

このメッセージにコメントを書く

2001/09/20 23:32

From:Masahiko Maedera <SGQ00310@nifty.ne.jp>

[XML MOJI 01148] Re: CESU-8: 枝葉末節にこだわっても...

参照先: [XML MOJI 01146] Re: CESU-8: 枝葉末節にこだわっても... ("SHIBUYA Makoto" <mshibuya@est.co.jp>)

渋谷さん、川俣さん、久しぶりです。

> いろいろ書いてありますけど、結局はめんどくさい sarrogate
> 対応をやらないですます為の仕様ということでしょうか?

現状を、UTR や IANA という形で、追認しようということです。
もちろん、「内部コードでこう使うと便利ですよ」という
informative なものならいいのですが、
(SCSU "http://www.unicode.org/unicode/reports/tr6/" はその一例)
IANA に登録予定となると、周囲も黙っていなくて、

「内部コードを IANAに登録とはえらい矛盾じゃないか?」

という突っ込みもきています。

あの記述をみて、UTRの作者の深層心理のなかに、
IANA に登録さえしていまえば、しめたもので、
Surrogate 完全対応を未来永劫延期してしまおうという意図が
垣間見えてきます。

実は、この問題、根が深くて、業界「UTF-16 vs UTF-32戦争」勃発の
第一幕でしょう。まず、UTF-8 をコントロールするのはどちらか?
から始まり、そのうち、いろいろなところで、現実問題として
ユーザーに混乱を招く事態が顕在化するでしょう。
(ああ、考えたくもない。)

このメッセージにコメントを書く

2001/09/21 12:56

From:Akira Kawamata <autumn@piedey.co.jp>

[XML MOJI 01149] Re: CESU-8: 枝葉末節にこだわっても...

参照先: [XML MOJI 01148] Re: CESU-8: 枝葉末節にこだわっても... (Masahiko Maedera <SGQ00310@nifty.ne.jp>)

 川俣です。

 "Masahiko Maedera <SGQ00310@nifty.ne.jp>"さんは書きました:
> あの記述をみて、UTRの作者の深層心理のなかに、
> IANA に登録さえしていまえば、しめたもので、
> Surrogate 完全対応を未来永劫延期してしまおうという意図が
> 垣間見えてきます。
 好ましくないものは登録して名前を付けて、使うなと言うことが出来る、とい
う意見もあるようですが……。
 そういう意図での登録では無さそうですね……

-- 
 (株)ピーデー 川俣 晶 (http://www.autumn.org/ mailto:autumn@piedey.co.jp)

このメッセージにコメントを書く

メッセージスレッド: CESU-8: 枝葉末節にこだわっても...

問い合わせ先

 何か分からないことや問題が発生した場合は、本リスト板管理者の電子メールアドレス autumn@piedey.co.jp までお問い合わせください。

[XMLと文字メーリングリスト メニューページ][スレッド一覧][メッセージ閲覧][サイトのトップ]


List-Tei Iconりすと亭 (List-Tei 4.25.0) Copyright (c) 1997-2006 by Pie Dey Co.,Ltd.