ローカライズの難易度
ASCII内で表現可能なスペースで分かち書きする言語 難易度-0
ASCIIはこれ。 アクセント付き文字が含まれていないため、これに該当するのは厳密には英語しかない。
CP1252で表現可能なスペースで分かち書きする言語 難易度ー1
CP1252はこれ。 ASCIIにアクセント付き文字が含まれたため、スペイン語、ドイツ語、フランス語などのヨーロッパ諸言語が大体表現可能。EU4、CK2のデフォルトの文字コードがこれに当たる。
CP1252では完全に表現可能ではないが、ほぼ可能でスペースで分かち書きする言語 難易度ー1
例えば、トルコ語やヴェトナム語。
ğやưはCP1252にはない。これはCP1252で使わないアクセント付き文字をすげ替えればよい。
Unicodeの0x100~0xFFFF範囲(UCS2)にあるが、表現に必要な文字数がアルファベット程度で、スペースで分かち書きをする言語 難易度-2
ロシア語、ギリシャ語がこれに該当する。 これらは、CP1252のアルファベットの文字列をすげ替えて対応することで、対応できる
Unicodeの0x100~0xFFFF範囲(UCS2)にあり、表現に必要な文字数がアルファベット程度で、スペースで分かち書きをする右から左に進む言語 難易度ー10
これはヘブライ語しかない。 これの難しさは言語的な難しさよりもUIをどうするかという点である。
Unicodeの0x100~0xFFFF範囲(UCS2)にあり、表現に必要な文字数が256を超える言語 難易度-15
いわゆるCJK、中国語、日本語、韓国語がこれに該当する。容量の問題をクリアすれば、表現に必要な文字が予めUnicodeに定義済みのため、ギリギリ対応が可能。
Unicodeの0x100~0xFFFF範囲(UCS2)にあり、表現がそれらの合字で表現される言語 難易度ー30
インド系文字。
とりあえず下記を見て欲しい。 上記の画像はヒンディー語のデバナガリの例で、MSのサイトから取ってきたものだが、一筋縄ではいかないことがわかる。
下記はミャンマー語のビルマ文字の例だが、▂▅▇█▓▒░(’ω’)░▒▓█▇▅▂
ただし、オープンソースとしてよくメンテナンスされた組み立てエンジン(harfbuzz)が存在し、それを利用すれば可能かもしれない。
Unicodeの0x100~0xFFFF範囲(UCS2)にあり、表現がそれらの合字で表現される、右から左に進む言語 難易度ー35
アラビア語。
これもインド系文字と同様に文字の組み立てが発生する。ただし、それほどは鬼畜ではない。一方、右から左に進むというUI的な問題が同時に存在しており、非常に厳しい。ただし、これもharfbuzzを利用すれば可能かもしれない。