「英語は相手に通用すれば十分」と多くの人が思っているかもしれない。 世界で英語を話す約15億人のうち、約75%は非ネイティブだ。しかし、そこには残酷な格差が存在する。ペンシルベニア大学の研究によれば、英語に「アクセント」があるだけで採用率は16%低下し、資金調達の成功率は23%も下がるというのだ。となれば発音の明瞭さは、「あればいいもの」でなく、キャリアの成功には「なくてはならないもの」だとも言える。 この課題をテクノロジーで解決しようとするのが、ニューヨーク発のスタートアップ「BoldVoice(ボールドボイス)」だ。同社は、ネイティブ英語に近づける発音アプリを開発。ネットフリックスやマーベル作品で、俳優のアクセント矯正を指導するハリウッドのトップコーチのメソッドを、独自開発のAIモデルに落とし込んでいる。 わずか7名の少数精鋭チームながら、500万人のユーザーを獲得、年間経常収益は約15億円(1,000万ドル)を突破。2026年1月には約32億円の大型調達を成功させ、エドテック界の「超新星」として大きな注目を集めている。 「口から出る英語は、脳内にある英語ほど高度ではない」――学習者のもどかしさを語るアナダ・ラクラCEOに、AI時代のコミュニケーション戦略と、驚異的な組織効率の裏側を聞いた。
BoldVoiceの誕生は、CEOで共同創業者であるアナダ・ラクラ氏の移民としての経験が大きく関わっている。ラクラ氏はアルバニアで育ち、アイビーリーグの最高峰の一つ、イェール大学に進学。
アルバニアでの成績は常に「A」で、自分の英語は完璧だと思っていたという。輝かしい未来を確信して渡米した彼女、しかし待ち受けていたのは自分の英語が理解されないという過酷な現実だった。
「何度も「もう一度言って」と聞き返され、自分の言葉が相手に届かないことがあったんです。話し始めて数秒で「出身はどこ?」と聞かれて、そこで初めて自分にアクセントがあると気づきました。」
多くの留学生と同じく、非ネイティブの教師から英語を学び、発音を本格的に練習したこともなかったというラクラ氏。教室で特定の単語をどう言えばいいか自信が持てず、挙手するのをためらうようになった。また、就職面接では言葉に詰まったり、言い方がわからない単語を避けようとしてパニックにもなったという。
「「脳内の英語は高度でも、口から出る英語が追いつかない」という感覚は、移民にとって誰でもある経験です。またアメリカ国外であっても、英語がビジネス言語である以上、昇進や国際的なクライアントとのやり取りのために、流暢で自信に満ちた英語を話すことは極めて重要になっています。」
その10年後、彼女はハーバード・ビジネス・スクールに進学。しかしそこでも優秀な留学生たちが、かつてのラクラ氏と同様の苦労をしている光景を目にした。 ここには解決すべき大きな課題がある――ラクラ氏が強く問題意識を持ち始めた頃、音声AIが実用レベルで使えるようになってきたという幸運が重なった。
写真提供:BoldVoice
まずBoldVoiceがどのようなアプリなのか、簡単に説明しよう。
このアプリの最大の特徴は、ハリウッドのトップ俳優たちのアクセントを数カ月で激変させているアクセント・コーチのテクニックを利用している点だ。コーチが、舌の位置から音の作り方まで細かく動画で解説、それに基づいてユーザーが発音した音を、独自の音声認識AIがリアルタイム解析する。
特有のアクセントの癖をAIが分析し、ユーザーが最も改善が必要な音を重点的に練習できるように個別のメニューも用意する。
また、年間のサブスクリプション料金は2万3000円。一対一でプロのアクセント・コーチの指導を受けようとすれば、1時間で3万円以上はすることを考えると、かなり手が届きやすいアプリになっていると言える。
BoldVoiceの強みでもあり、最大のチャレンジは音を正確に評価する精度にある。
「音声認識AI」と一言で言っても、アマゾンの音声アシスタントのアレクサ(Alexa)、アップルのシリ(Siri)といったAIは、英語のミスがあってもそれを無視して全体の意味を捉えることに優れている。
一方、BoldVoiceの音声認識はミスを徹底的に拾うように設計されている。ただ音の添削は、文法の正・不正解を判断するのと違い、正解が一つとは限らない。
「例えば、Syllable(音節) の最後のLの音などは、マイクの入力品質によっては非常に聞き分けにくく、人間には聞こえてもAIには曖昧に聞こえてしまうことがあります。また発音には「許容される多様なバージョン」があって、どこまでを許容範囲として、どこからをアクセントが強すぎだと判断するか、その定義も難しいのです。」
BoldVoiceでは、音の単位で正確性を判定するスコアリングモデルに加え、アクセントの強さよりも、ネイティブ・非ネイティブ双方にとって「理解しやすさ」を判定する明瞭度モデルや、単語の正しい音節にアクセントがあるかを測る強勢モデルなど、複数のモデルを掛け合わせている。
「音を正確に判別するための、膨大なデータラベリングと微調整が常に課題です。AIが誤判定をするとユーザーの信頼を損なうため、常に最高の精度を追求し続けています。」
現在は、言葉の間隔に当たるピッチやイントネーションを捉える新しいモデルも構築中だ。目標は、AIを「人間のコーチの耳と同じくらい正確にする」ことだラクラ氏は話す。
BoldVoiceが対象にするのは、中級以上のレベルで英語を学ぶ約15億人の人たちだ。 特に、金融、コンサルティング、ホスピタリティ業界など、英語でのコミュニケーションが必須スキルとなる「ホワイトカラーの専門職」にいる人たちがコアのターゲットになる。
その中において、日本は彼らのトップ市場の一つを占める。
「現在、最も多いのはアメリカですが、これは私たちがアメリカで生活・就労している移民の人たちを最初にターゲットにしたからです。しかし、成長とともに国外へも需要が広がり、日本は月によって2位〜3位の規模になります。」
他には韓国、中国、メキシコも大きな市場になっているという。スマートフォンを使って1日15分ほどの練習を繰り返すという方法が、忙しいライフスタイルのユーザーにマッチしているようだ。
最近ではDuolingo、SpeakやPraktikaなどAIを用いた語学学習系が多く出てきている。リアルタイム翻訳ツールも普及してきており、そんな時代において改めて「自分の声」を磨く必要はあるのだろうかという疑問も湧いてくる。もちろん、ラクラ氏の答えはYesだ。
「スピーチやコミュニケーションは「深く人間的なもの」だと信じています。ロジスティクスや実務がAIに取って代わられたとしても、人間に残されるのは「批判的思考」と「コミュニケーション」。実生活でのシームレスな翻訳機が普及するまではまだ数年かかるでしょうし、何よりコミュニケーション能力は、ビジネスパーソンとしての「核となるアイデンティティ」の一部であり続けることに変わりはないのです。」
BoldVoiceは2021年に創業、現在では世界に500万ユーザーを獲得し、年間経常収益は約15億円を突破する。通常この規模の収益を上げる企業であれば、数十人の社員がいてもおかしくないかもしれないが、BoldVoiceはわずか7人の社員でこの成長を遂げている。
ラクラ氏は人材を「1人で10人分の成果を出す人物」にこだわって採用してきた。
ユーザー、売上げがゼロ、何の将来も約束されていないスタートアップだった時には、優秀な人物がなぜBoldVoiceで働くべきなのか説得するのに苦労もした。しかし、その当時から変わらない哲学は、自分で責任を持ち、自律的に動ける非常に優秀な人材だけを徹底的に選んできたということだ。
また、ここ1年ほどのAIツールの進化により、コードの作成やプロトタイプの開発スピードが劇的に上がっていることも、少人数で多くの機能を素早くリリースできることを可能にしている。
今年に入って約32億円の資金調達を達成したが、この資金の多くを人材獲得に使う予定だ。
「すぐに7人から100人へと増やすようなことはしませんが、エンジニアリング人材を中心に2倍にまで拡大したいですね。より精緻な機械学習モデルの構築と、新機能の開発を進めたいと思っています。」
ネイティブのように英語を話す――というのは、実はアクセントを直すことだけで達成されるものではない。
ラクラ氏たちが目指すのは、アクセントがなくなり、話者が「自信を持って話す」ことができるようになることこそが最終ゴールだという。
「第一のゴールは言葉の「明瞭性」です。相手に苦労なく理解してもらえるかどうかを目指します。第二のゴールは「自信」です。周囲からも「自信に満ちたコミュニケーター」だと認識される状態に持っていきたいと思っています。」
そのためには流暢さだけでなく、話す時の姿勢や伝え方といった言葉以外の要素も重要になる。BoldVoiceは、単なる発音ツールから常に寄り添う「コミュニケーション・パートナー」へ進化するため、今後必要なこともしっかり見据えている。
「自信を持って話すには、「少し早口すぎるので、落ち着いて」、「プレゼンのこの部分はもう少し大きな声で」といったアドバイスも必要になります。あるいは、実際の会議中に「今、相手の話を遮ってしまいましたね」といったリアルタイムのフィードバックも有効でしょう。実生活のあらゆる場面で、あたかも隣にコーチがいるような体験をこれから提供していく予定です。」
テクノロジーがどれほど進化しようとも、最後に人の心を動かすのは、その人の「声」に宿る熱量と自信に他ならない。そして、BoldVoiceが磨き上げるのは、アクセントをこえて世界と対等に渡り合うためのプロフェッショナルとしての誇りそのものなのだ。
Anada Lakra(アナダ・ラクラ) BoldVoice 共同創業者&CEO
アメリカのイェール大学およびハーバード・ビジネス・スクール(MBA)を卒業後、ペロトンなど複数のスタートアップでのキャリアを経て2021年にBoldVoiceを設立。「発音」を言語習得の核と捉え、AI技術を活用したアクセント矯正の英語学習プラットフォームを展開。言語の壁によるキャリアの機会損失をなくすことをミッションに掲げ、世界中のプロフェッショナルが自信を持って発信できる社会の実現を目指している。現在は、言語学の知見と最新の音声AIを融合させたプロダクト開発を牽引し、エドテック分野で大きな注目を集めている。
英語のアクセントは、それもまた話者の個性だと私は考えています。でもアクセントによって、キャリアのチャンスが制限されてしまうのも事実。私も実際にBoldVoiceのアプリを使ったことがありますが、自分が正しいと思っていた音が実はアクセントだったりすることを気付かされ、とても勉強になりました。ユーザーによる膨大な音声データは、どこにアクセントがあるのか、どこに間があり、イントネーションが違うのかなど、国や生活スタイル、文化などを反映した「人間の思考データ」になります。これらのデータ使ってBoldVoiceがどのような機能の搭載していくのかとても楽しみです。