毎日午前7時にブログ更新

【Mac】杖道は浄土? 音声入力の沼でOSSアプリ「Amical」と格闘する

情報管理

【Mac】杖道は浄土? 音声入力の沼でOSSアプリ「Amical」と格闘する

2009年からMacを愛用している。かれこれ15年以上の付き合いになるが、常に頭を悩ませてきたのが「テキスト入力環境の最適解」だ。ただのガジェット好きとして、少しでも楽に、効率的に文字を打ちたいという欲求は尽きない。

思考をダイレクトにテキスト化できる音声入力は、一度慣れると手放せない。直近では「Aqua Voice」の爆速レスポンスを愛用していたが、試用期間が終了。サブスクリプションを継続するか悩んでいた矢先、新たな選択肢が現れた。

それが「Amical」だ。

オープンソース(OSS)で開発され、ローカル環境でWhisperが動作する。プライバシーの心配がなく、何より無料で自分好みに環境を構築できる点に惹かれた。長年のMacユーザーとして、こういうツールをいじくり回すのは嫌いではない。

しかし、現実はそう甘くなかった。

単語登録という名の「モグラ叩き」

導入直後、壁にぶつかった。私の専門領域である漢方用語や、趣味の武道(杖道)の用語がまったく変換されないのだ。

「桂枝湯」が「ケーストン」になり、「虚証」が「巨匠」になる。

Amicalの設定画面にある「Vocabulary」に登録してみるものの、一向に賢くならない。ひたすら「間違った単語」と「正しい単語」のペアを登録し、事後修正させるルールを作っていく作業。これでは音声入力の快適さどころか、ただのモグラ叩きである。

疲弊したところに、有料アプリ「Typeless」が検索エンジンをかすめる。「もう課金して、AIに勝手に整文してもらったほうが楽なんじゃないか……」。ベテランMacユーザーとしての意地も揺らぐ瞬間だった。

AIからの啓示。「スイッチはOFF」が正解だった

ここで諦めては、Mac歴十余年の名がすたる。私は生成AIに相談を持ちかけ、Amicalの挙動について徹底的に分析した。そこで、根本的な勘違いに気づかされた。

私が必死に行っていたのは「Replacement(置換)」だった。しかし、Whisper系エンジンの真骨頂はそこではなく、「バイアス(Bias)」をかけることにあったのだ。

AmicalのVocabulary登録画面には、「Make it a replacement」というスイッチがある。私はこれを親の仇のようにONにしていたが、正解は「OFF」のまま単語を登録することだった。

読み仮名すら不要。ただ「桂枝湯」「乱合」という漢字を登録するだけでいい。それだけで、AIに対して「これからの話には、この単語が出てくる確率が高いぞ」とヒント(バイアス)を与えることになるらしい。

杖道は浄土へ? 新幹線での実戦テスト

理屈はわかった。善は急げだ。私は移動中の新幹線の中でMacBookを開き、再設定を行った。

結果は劇的だった。

あれほど認識しなかった杖道の技名「乱合(れんごう)」が、一発で変換されたのだ。読みも教えていないのに、文脈と漢字のバイアスだけで正解を導き出した。これには、ただのガジェット好きとしても唸らざるを得ない。

しかし、まだ完全勝利とはいかない。

漢方の「虚証(きょしょう)」は、やはり「巨匠」や「挙証」といった強力なライバル単語に負けてしまうことが多い。

そして極めつけは「杖道(じょうどう)」である。 AIは自信満々にこう出力した。「浄土」と。

武の道を歩んでいたはずが、いつの間にか極楽浄土へ導かれていたらしい。新幹線の座席で、思わず苦笑いしてしまった。悟りを開くにはまだ早い。

結論:Amicalとは「育てる」ガジェットである

同音異義語の壁は厚い。ライバルが多すぎる単語については、あえて「Replacement(置換)」機能をONにして強制的に書き換えさせるなど、使い分けが必要なこともわかってきた。

「Typeless」のように、課金して快適な環境を買うのも賢い選択だろう。だが、私はあえてこの少し手間のかかる「Amical」と付き合っていくことに決めた。

うまくいかない部分をハックし、設定を詰め、自分だけの環境を構築していくプロセス。それこそが、Macを長年使い続けてきたガジェット好きの楽しみ方だからだ。

「浄土」に行き着く前に、まずは「杖道」と正しく認識させること。当面の目標はこれに決まった。私の音声入力探求の旅は、まだしばらく続きそうである。

 

コメント

タイトルとURLをコピーしました