ブローグ横丁

2019年2月5日 InDesign「他言語の混植」について。

お疲れさまです、佐藤です。


ちかぢか、
他言語が混植する仕事が発生しそうな予感があり、
試行錯誤中のわたくし。

InDesignは、
『言語』ちゃんと指定しないと、正常に表示されないので、
(ハイフネーション、合字、スペルチェックなど)

『日本語』の文字組み中に『欧文』が混植ささる場合には、
「正規表現スタイル」で対処していますが、

3言語以上となると.........
一体、どうすればいいの?!


InDesignは、
HTML(とJava script)を参考にできる所も多いため、
もしかしたら......と思い、"そっち系"のプロフェッショナル、
K大先生(いつもありがとうございます。)に質問を投げましたところ、


----------------------------------------
Unicodeは、

日本語漢字、簡体字、繁体字など、
複数の文字が入り乱れて配置されているため、
「正規表現」での抽出は、出来ない。
----------------------------------------

との、回答がきました。

であれば、


----------------------------------------
「日本語」以外は「簡体字」っていう、
判断すればいいのでは?
----------------------------------------

ということになり、
検証してみました。

『日本語』以外を『繁体字』にして、
さらに、『ハングル』と『欧文』にスタイルをかけます。
↓↓↓↓↓↓↓↓↓↓↓↓


tagengo_1.png


それぞれ、
下記の文字色になるように、スタイルを作っています。


〈文字スタイル〉
--------------------------------------
「日本語」→→→スミ
- - - - - - - - - - - - - -
「欧文」→→→緑
- - - - - - - - - - - - - -
「中国語(簡体字)」→→→青
- - - - - - - - - - - - - -
「ハングル」→→→赤
--------------------------------------


そうした結果が下記です。
↓↓↓↓↓↓↓↓↓↓↓↓

tagengo_2.png

↑↑↑↑↑↑↑↑↑↑↑↑↑↑

「簡体字」も漢字としてマッチしちゃう.........。
(ピンイン未確認)

そして、、、、、

tagengo_3.png

「ハングル」の句読点に、
「欧文」のスタイルが、当たっちゃっております。

そうなると、、、、、

tagengo_4.png

↑↑↑↑↑
「日本語」内の半角英数字にも、マッチしてしまうことになり、


これは、結局、
一つひとつに、スタイルを当てた方がよいのだな、
という、結論に達しました.........。


もしくは、
原稿をおこす時点で、言語毎に"印"で囲っていって、

「検索と置換」の正規表現で、
一言語ずつ、スタイルを当てるか。。。

↓↓↓↓↓↓↓↓↓↓


tagengo_5.png

いずれにせよ、

==============================
他言語は、
「正規表現スタイル」で、
自動で処理しないほうがいい。
==============================

という、結果となりました、、、、


だから、せうぞー先生は、
ハングル"のみ"の、混植しかしていなかった(できないから)
のですね。
http://d.hatena.ne.jp/seuzo/20090707/1246946033

そして、

==============================
他言語問題を、
「正規表現スタイル」で処理しようとすると、
尋常ではない重さになるので、
絶対にやめたほうがいい。
==============================

です。

(虹色の丸いアイツが、
永遠とも感じられる長い時間、グルグルすることになります。)

言語毎に、ちくちくやるしかないのか。。。


でも『他言語問題』は、今後 必ずブチ当たる問題なので、

「こんなやり方で乗り切っているよ!」という
先生方がこの世のどこかにいらっしゃるのであれば、
ご教授いただけると、ものすごく助かります.........。


ていうか、誰かまじで教えて。。。

コメントを投稿する

このページの先頭へ