変換の仕組み

最新のUnicode技術と伝統的な字形の知恵の融合

1. ホモグリフ(異体字)置換

「ホモグリフ(Homoglyph)」とは、字形が酷似しているが異なる文字コードを持つ文字のことです。
例えば、日本語の「あ」という文字に対し、Unicodeには視覚的に区別が困難な複数の「異体字」が存在します。

  • IVS (Ideographic Variation Sequence): 漢字の微細な書き分けを表現するための枝番号技術を活用。
  • 広域Unicodeマッピング: 20,000字を超える漢字辞書を内蔵し、最適な置換先を選定。
  • 多言語対応: 英語、ひらがな、カタカナそれぞれに特化した置換アルゴリズム。

2. ゼロ幅文字のランダム挿入

「ゼロ幅文字(Zero Width Characters)」は、画面上の表示幅がゼロであり、人間の目には全く見えない特殊な文字コードです。

「隠密」は、単語の間にこれらの文字をランダムな回数挿入します。これにより、単語「田中」はシステム内部では「田[不可視文字]中」となり、キーワード検索エンジンが単語を正しく認識できなくなります。

主に使用される制御文字:

U+200B (Zero Width Space)
U+200C (Zero Width Non-Joiner)
U+200D (Zero Width Joiner)
U+FE0F (Variation Selector)

3. 独立トークン処理アルゴリズム

本ツールは、入力をスペースや改行で区切られた個別の「トークン」として解析します。
各トークンに対して独立して置換率の計算と不可視文字の挿入を行うことで、文章全体の整合性を保ちつつ、検索避けの強度を最大化しています。

ハッシュタグやURLを検知し、それらを変換対象から自動的に除外する保護機能も搭載されており、SNSでの利便性を損なうことなく隠密化を実現します。