The Man Who Fell From The Wrong Side Of The Sky:2008年8月10日分

2008/8/10(Sun)

[NetBSD] multibyte regex その2

なるせさんとこより鬼車ネタ続き。

どうみても unsigned char 単位です、本当に(ry

なるほど。

粛々とマッチとは言っても、実際のところここをいったいどうするかが
問題で、無駄なエスケープシーケンスをどうするかや、同じ文字でも
バイト列が異なる表現になりうる場合とかを考え出すと、いくらか工夫が
必要なんだろうなぁ。

これかなりめんどくさそうなんですよね、そもそも何が正しい動作なのか?とか。
nvi-m17nのISO 2022 aware regexを調査すればヒントがあるかも。
ただ現状いろいろ制限設けてた記憶がありますが。
[A-Z]の場合、AとZは同じescape escapeでなければダメとか。

しかし、Citrus って内部は 32bit wide character だった気もするので
逆に複雑化するんだろうか。

まぁCitrusに新しいAPIを追加すんのは誰も反対しないと思われるので
regencまわりを完全に置き換えるのに十分な機能を用意するのはOKですんで
そっちの作業は私がやるにしても正規表現エンジンの方を
誰かメンテできんの?ってのが問題だったり(以下求人広告ry

どっちみちNetBSD的にはmultibyte regexより先に
LC_COLLATEを実装しないとあかんのよな。
まぁそうすっとmklocale(1)ですらかっちょわるいのに
その上colldef(1)とかイヤンなのでlocaledef(1)を、ちゅう話なんだな。

tech-userlevelにsodaさんからちょっとおもしろい 調査結果きてますな。

それと明日こそahoka氏に返事書く。

今日

ゆでたてトウモロコシうまうま。

糖度15の高い桃買ったがあんま甘くなくてショボーン。

マイクロフォーサーズだと。
こんだけ フランジバック短くするとマウント変換アダプタ作りやすいので
ありとあらゆるレンズで遊べそうな奇ガス。
まぁイメージセンサが所詮4x3なんでフルサイズ比で画角2倍だから
何でも望遠になっちまうし、そもそもマニュアルフォーカス + 絞り込み測光
めんどくさいし実用性ゼロなのは承知の上で。
まぁOLYMPUS-PEN Fとか小型化大好きな会社だしな。

ここでSONYがMicro APS-CとかいってMinolta Vマウント復活とかあるあ...ねーよ。