About PhantomWords
The Unwritten Dictionary / 書かれざる辞書
PhantomWordsは、まだ誰も知らない「幻の言葉」を発見し、収集するためのプロジェクトです。
ここに掲載されている単語と定義は、すべてアルゴリズムによって自動生成されたものです。それらは実在しませんが、どこかに存在していてもおかしくないような、不思議な響きと意味を持っています。この辞書をめくることで、あなたの創造性が少しでも刺激されれば幸いです。
How It Works / 仕組み
この辞書は、マルコフ連鎖 (Markov Chain) という確率モデルを基盤技術として利用しています。
1. 単語の生成 (Word Generation)
まず、約10万語が収録された古い英語の辞書データ(Webster's 1913 Unabridged Dictionary)を学習します。アルゴリズムは、単語の綴りに見られる文字の並びのパターンを記憶し、「この文字の次には、どの文字が来やすいか」を確率的に予測します。この連鎖を繰り返すことで、元の辞書に似た響きを持つ、まったく新しい単語(造語)が生まれます。
2. 定義文の生成 (Definition Generation)
次に、生成された造語にふさわしい「それっぽい」定義文を作成します。これもマルコフ連鎖を利用しますが、今度は文字単位ではなく単語単位で行います。辞書に収録されているすべての定義文を学習したモデルが、文法的に自然で、かつ辞書らしい文体の新しい文章を紡ぎ出します。
3. 翻訳 (Translation)
生成された英語の定義文は、Google Apps Script (GAS) を利用して構築した独自のAPIエンドポイントを通じて、日本語に翻訳されています。これにより、サーバー費用をかけることなく、安全に翻訳機能を提供しています。
Credits / クレジット
このプロジェクトは、以下の素晴らしいデータとライブラリの上に成り立っています。
- Dictionary Data: Webster's Unabridged Dictionary (1913) provided by the Project Gutenberg.
- Pull-to-Refresh: pulltorefresh.js
- html2canvas: html2canvas.js
- Developed by: 或いは夜 (GitHub)