2011年3月19日土曜日

Unicodeに大量の同じようなアルファベットがあるのを発見したのでその顛末を纏めてみる。

というわけでいつものjunerです。この前ちょっとついでにUnicode表を眺めていたのですけれど、フォント違いのアルファベットが大量に有ることを見つけました。

で、見つけたのはUnicode一覧 1D000-1DFFFですね。

とりあえず気になる文字を見つけたらツイートする習慣のある私はいつもの #unicode ハッシュタグを付けて以下の様に呟きました。

なんでこんなに被っとんの……アルファベット編1 #unicode 𝑨𝑩𝑪𝑫𝑬𝑭𝑮𝑯𝑰𝑱𝑲𝑳𝑴𝑵𝑶𝑷𝑸𝑹𝑺𝑻𝑼𝑽𝑾𝑿𝒀𝒁

いやはや……ホントこんなアルファベットがあるとは……。しかも13通りも。とはいえ、私の環境では2通りは観ることが出来ませんでした。はてさて……Firefoxなら他のフォントからも探してくれるから見れる気がしますけれど。

で、なんでこんな文字が存在するのかと言うと、U+1D400-1D7FFがMathematical Alphanumeric Symbols……つまり、数学用英数字記号として定義されているからなのです。要は13通りとも全部数学用の英数字記号って訳。ちなみに途中でホイホイ抜けてるのは他のところで既に定義してしまっている文字だからコード順を保った儘それを当てはめる為と思われます。

とは言え、私がそんなツイートを立て続けにしている頃にフォロワーのなっちゃんさんことna2hiroさんが本来の用途についてのURLを探して来たみたいでそれも掲載しておきます。→ Mathematical Alphanumeric Symbols

まぁそんな感じでしょうか。因みに、BloggerでなんかUnicodeのU+10000以降の入力が出来ないらしいので。今回の特定文字は数値実態参照で𝑨なら𝑨みたいに入れてやっています。ほいほい入力出来るようにならないかなー。ホント面倒だ。