【コエステ】”声のプラットフォーム創り” への挑戦

〈プロフィール〉
株式会社コエステ
執行役員
金子 祐紀 氏

2005年に株式会社東芝に新卒入社。ソフトウェアエンジニアとしてキャリアをスタートし、クラウドTVやメガネ型ウェアラブル端末等の新規事業の立ち上げに携わる。2016年より、音声合成技術を活用した声の新しいプラットフォーム「コエステーション」事業の立ち上げに責任者として携わる。2020年2月にエイベックスとのJVでコエステ株式会社を設立し、執行役員として事業開発を推進している。エイベックスと東芝デジタルソリューションズのJVとして、”声の新しいプラットフォーム” を作ろうとする「コエステ」事業。JV設立以降、両社のアセットを活用しつつ、次々と新しい仕掛けを展開し続けています。

その事業立ち上げの背景には、東芝の中で様々な新規事業を立ち上げてきた事業責任者の活躍がありました。東芝時代の非常に強烈なエピソードにも触れながら、”声のプラットフォーム”という新しいチャレンジの展望について取材しました。

目次

導入

エイベックスと東芝デジタルソリューションズのJVとして、”声の新しいプラットフォーム” を作ろうとする「コエステ」事業。JV設立以降、両社のアセットを活用しつつ、次々と新しい仕掛けを展開し続けています。
その事業立ち上げの背景には、東芝の中で様々な新規事業を立ち上げてきた事業責任者の活躍がありました。東芝時代の非常に強烈なエピソードにも触れながら、”声のプラットフォーム”という新しいチャレンジの展望について取材しました。

「録画の神」と「レグザの父」との出会い

―まずは金子さんのこれまでのキャリアについてお聞きしたいと思います。新卒で東芝に入社してから経験してきた業務について教えてください。
2005年にソフトウェアエンジニアとして東芝に入社しました。テレビ関係のソフトウェアを設計/製作する部署だったんですが、一番最初に配属されたのが「HD DVD」の規格部門でした。そこからテレビ系のソフトウェアエンジニアとしてキャリアを積んでいましたが、2011年に転機となる出来事がありました。

―どのような転機だったのですか?
業界で「録画の神」と呼ばれていて有名な片岡秀夫さんという人がいるのですが、その人から「新しい部署作るから来いよ」と誘っていただいたんです。それが転機となりまして、それからは新規事業系のキャリアがスタートしています。

―どのような経緯でのオファーだったんですか?
新規事業の部署が新設されることが決まって、その部長に片岡さんが就任することになったんです。もともと片岡さんとは知り合いでしたが、夜11時くらいに仕事をしていてそろそろ帰ろうかと考えていたら、いきなり「社長の承認取れて、部署を作る事になった」と電話がありまして。
そして、次の日の朝会社に行ったらすでに兼務発令が出ていました。当時の上司も「金子君!これ、どういう事?」と驚いていましたね(笑)。

―すごくドラスティックな人事ですね!その部署ではどのような仕事から関わり始めたんですか?
最初に携わったのがクラウドテレビの新規事業でした。僕はもともとテレビ番組が大好きだったのですが、テレビにインテリジェンスをつけるともっと面白くなると考えていて、本当にやりたいことが出来るぞ!という気持ちでしたね。
従来のテレビは、基本的には「売って終わり」というビジネスだったのですが、利便性と収益性向上のためにクラウド型にして、テレビ内のブラウザで様々なサービスが動くような仕組みを作り始めました。

―今で言うスマートテレビの先駆けのような概念ですね。
そうです。先駆けということで注目も集まって、様々な賞も貰って、「アメトーク」の家電芸人で紹介してもらったりもしました。

―非常に濃密なご経験ですね。
僕のキャリアの中では、そこが1番の大きな転機でした。もともと理系出身でエンジニアとしてのキャリアを考えていたのですが、そこから新規事業の企画に進むことになって、事業企画のイロハもそこで学んだんです。
「録画の神」の片岡さんが僕の上司だったのですが、同じ事業部に「レグザの父」と呼ばれていた本村さんという方もいまして(笑)。東芝の中での2大有名人と近くで仕事出来たのは非常に良い経験だったと思います。人生で一番しんどい修行期間でもありましたけど。

―象徴的なエピソードはありますか?
ある時に片岡さんから「クラウドサービスのリモコンボタンを勝ち取ってこい」という指令がありまして、レグザの父・本村さんに「リモコンボタンの良いポジションをください」と相談に行ったんです。
「どこにボタン置きたいんだ?」と聞かれたので「ど真ん中が良いです」と答えたら、「お前な、リモコンは限られた土地にボタンを建てていって街をつくるようなものなんだ。新しいボタンを増やすなら今ある別のボタンを減らさなければならない。そんな使うかどうかも分からないような新機能に対して銀座三丁目の土地を渡せるか!」と(笑)。
そういった感じで、とにかくその2人の間に挟まれながら、ひたすらしごかれた期間でした。

―その部門ではどのくらいの期間いらっしゃったのですか?
3年ほどで、その期間でゼロからクラウドテレビ事業を立ち上げました。サービスとしての機能だけでなく、独自で広告収入を得るモデルや、視聴行動履歴データを集めて、何かに活用出来ないか模索したりと、考え続けた3年間だったと思います。

―その次も新規事業の立ち上げに関わったんですよね?
次はコーポレート社長直轄の新規事業開発の部署が新しく出来て、そこに異動しました。そこで取り組んだのが「眼鏡型のウェアラブル端末」の事業です。

―当時からするとウェアラブル端末の先駆けの時代ですね。どのようなところから着想されたんですか?
研究所にすごい技術があったので、その技術をうまく生かそうという発想から始まりました。その上で、僕はまず「それが面白いと思えるかどうか」で考えます。最初からトレンドや市場などから考えず、あくまでも「自分がワクワク出来るか」というところからスタートしました。

―自分なりの見立てで面白いと思える要素があるか、から考えるのですね。
そうですね。そのウェアラブル事業では、眼鏡をかけるだけで1.5m先に透明なスクリーンが浮かんで、情報の表示も出来るし、骨伝導のイヤホンマイクによって、喋ることも聞くことも出来るといった構想を描いていました。
これはスマホだと実現が難しいので、まずは専門のデバイス起点でアプローチしていました。

―課題の大きいシーンを特定して考える方が良さそうですよね。
まさしくそのように考えまして、まずはBtoBで課題の大きそうな現場に着目して「業務効率を改善するデバイス」として、ソリューションとセットで展開する方針にしました。例えばですが、トンネルの老朽化検査のシーン。検査の際には、コンコンコンって鳴らしながら、離れたところにあるモニターを都度見に行ってチェックして、またコンコンコンと鳴らしている、という非効率がありました。それが、このソリューションを使うと、わざわざモニターを見に行く手間がなくなるので劇的に業務効率が改善することが出来る、と。

―まさしく課題に対するソリューションなので、審美性の面でのハードルもなくなりますね。
そうなんです。ただ僕としてはその先のコンシューマー市場も見据えていたので、仮に業務用途だとしても、ある程度ファッショナブルで軽いものが作れないと、その先の拡がりがないだろうと考えていました。
ですので、技術面の進め方としても、軽く、細く、オシャレに、という点にこだわって開発を進めていたんです。その甲斐もあって、2016年の2月29日に発売も決定して、様々な賞も受賞できて、先行予約も開始することになったのですが。そのタイミングで、例の会計問題が起こりまして。

―なるほど・・・。
そのような問題が起きた時に最初に煽りを受けるのが新規事業なんですよね。止めるのであれば発売前の今のタイミングだ、ということになり、発売予定日の1週間前の2月22日に発売中止というアナウンスをすることになりました。

―事業はその後お蔵入りになってしまったんですよね。どうやって自分の気持ちに折り合いを付けたのですか?
もう泣きましたよ。大人になって初めて、あんなに泣いたなと思いました。
1つは悔しさと頑張ってくれたチームメンバーや協力企業などへの申し訳なさから、もう1つはニュースで事情を知った知人から慰めの言葉も沢山もらって、嬉しくて泣きました。

―ものすごいご経験ですね。その後はどのように再起されたんですか?
正直、会社を辞めようか本気で悩んでいましたが、当時の上司から「なんとか残る道筋はないのか?」という話をされまして。
その時に音声合成や音声認識といった技術が育ってきて事業化を進めていることを知っていたので、「新規事業に携われるなら残ります」と話して、その領域の新規事業に関わることになりました。その経緯で立ち上げたのが「コエステ」の事業になります。

「音声合成」に着目したプラットフォーム構想

―音声合成/音声認識という新しい領域に対して、どのようにアプローチを開始されたんですか?
僕が加わる少し前から、この領域で事業を作るための動きが始まっていたのですが、なかなか事業として立ち上げられていない、という状況でした。
僕もこの領域に関しては素人だったので、どんな技術なのか?どのような可能性があるのか?を確かめるために、ひたすら自分で使ってみたり、専門家に話を聞きに行きました。

―その結果として、どのような事業機会を見出したんですか?
持っていた技術の中でも「音声合成」がピカイチという結論に至りました。
カタコトでしか喋れないと思っていたのですが、かなり流暢に喋ることが出来る技術があり、誰かの声に似せて喋ることが出来るところにとても興味を持ちました。そこで考えたのが「コエステ」というプラットフォームの構想でした。

―音声合成ツールではなく、最初から「プラットフォーム」の構想だったんですね。
最初からプラットフォームの構想はあり、「声」ではなく「人」のプラットフォームだと捉えて設計していました。「人が喋る」という機能をデジタル保存して、様々なシーンに展開していく構想です。例えば、音声合成の研究者が設計をしていたら、おそらく「声」自体に着目して、「可愛い声/イケメンボイスを追加しました」みたいな打ち出しになっていたと思うんです。

―「人」ではなく「声」そのものに着目してしまうと。
その通りです。確かにそこにも一定のニーズはあると思うのですが、僕が目指したいのはそこではないんです。例えば、「毎朝自分の好きなアイドルの声で起こしてもらいたい!」と思っているとして、ほとんどの人がそのアイドルの声色が好きなわけではなく、そのアイドルそのものが好きだからその声で起こしてもらいたいんだと思うんです。

―「人」を軸に考えて、その声を集めていくプラットフォームということですね。
そうです。一般ユーザーの声を何万人も集めてるのはそこが理由で、代わりが効かないんですよね。おじいちゃんが孫の声でメールの読み上げを聴きたいと思う理由は、「孫だから」なんです。子供っぽい声だったら良いわけではない。価値の源泉は人にあって、副次的にその声にも価値が生まれている。そういう部分を大事にしながら設計を進めていきました。

「声の新しいプラットフォーム」を創る

―改めて、「コエステ」事業の詳細をお聞かせいただけますでしょうか?
コエステは音声合成の技術を活用した「声の新しいプラットフォーム」です。
いくつかの文章を声に出して読んでいただくだけで、その人の声の特徴をAIが学習して、その人の声のモトのようなものを生成します。僕らはそれを、カタカナの「コエ」と呼んでいるんですが、その「コエ」を音声合成のエンジンにセットして、文字を入力するだけで、その人の声で喋らせることが出来る、というのがコアな機能になっています。
その機能を使って、有名人から一般人まで、様々な人の「コエ」を集めて、企業側に提供していくという事業です。

―実際に聞きましたが、クオリティがものすごいですよね。本当にどちらが本物か分からないレベルだと思います。
淡々と喋らせる分にはかなりクオリティが高いと思います。公式で有名人などの声を登録する場合でも、だいたい1時間〜3時間、300文程度の読み上げ収録で、商用利用にも耐えられるようなクオリティの高い「コエ」を作ることが出来ます。

―これは革命ですよね。
従来技術で同じようなクオリティでやろうとすると、数千文程度読んでもらう必要があり、そうなると4日間スタジオに缶詰とかになってしまって、コスト/スケジュールの面で厳しいケースが多くありました。現在では、一般の方も含めて、8万人以上の「コエ」が集まっているという状況です。

―今の形になるまで、どのようなプロセスで事業立ち上げを進めていったんですか?
まずは技術の要点をキャッチアップしながら、専門家の方々に話を聞くところからスタートしました。その中でビジョンに共感してくれた外部の専門家の方々の協力を得ることも出来まして、音声合成の専門知識は補ってもらいながら事業開発を進めていきました。

―社内での事業化の承認自体はどのように進めていったんですか?
開発予算を取るために、正攻法で順番に企画稟議を通していって、最終的に社長承認をいただくことが出来ました。
「100年後にも役に立つデジタルインフラに出来る可能性がある」という部分をプッシュした点が良かったと思います。実際、例えご本人が亡くなってもコエ(デジタルボイス)は活躍し続けるというような世界になるかもしれないなと思っています。

―エイベックス社とのJVの構想は、いつぐらいから検討されていたんですか?
実は最初の企画構想の段階から外に出すことは考えていました。東芝の技術は素晴らしいのですが、品質面での要求水準が非常に高いので、自社内で立ち上げることは向いていないという考えはあったんです。
東芝の中でこの事業だけ治外法権にすることは出来ないので、事業を育てるハコを独立させるしかないと思っていて、その立ち上げ方針自体は社長も含めて承認をもらっていました。その中で、芸能界とのコネクションやエンタメ系の強みを持つ企業とパートナーシップを組むことが、この事業をドライブしていく上で重要と考えて、一緒に取り組めそうな企業を探していました。

―非常に懐が大きいですね。実際のJV組成まではどのような経緯で進んでいったんですか?
当時、「始動」という経産省のグローバルイノベーター育成プログラムに通っていたのですが、その時にメンターをしていただいたGCAテクノベーション株式会社 久保田さん経由で、現コエステ社長にも就いていただいているエイベックスの加藤さんを紹介いただいたんです。
話してみたらすぐに意気投合して、お互いの足りない部分を補えるベストパートナーであると考えて、提携を決めました。加藤さんからも、多くの大企業同士のオープンイノベーションはふわっとした話になりがちだけど、コエステは組むことで具体的なシナジーを生み出せるイメージができたと言ってもらっています。

―今後の事業としての展望もお聞かせいただきたいと思いますが、まずはtoC/toBのそれぞれの位置づけはどのように捉えていらっしゃいますか?
ビジネスとしては、まずはtoBメインで考えています。様々な企業様に音声合成のツールとコエの利用権を提供して、様々なシーンにおいて価値を作っていただく、というところから展開しています。

―ローンチ後の企業側の反応はどのようなものですか?
思った以上に多種多様な業種/サービスの企業様からお引き合いをいただいています。特に特定のセグメントに絞ってはいなかったのですが、事前に想像していたよりもユースケースは広いと思っているところです。

―印象的なユースケースはありますか?
例えば介護業界において、「孫の声を使って高齢者の安否確認をしたい」といったニーズがあります。このシーンにおいて「声」というのはとても重要で、例えば、認知症の患者さんは家族の声にだけ反応したりすることもあるそうなんです。

―まさしくコエステが活きるユースケースですね。声の提供側の方々の反応はいかがですか?
特に声優さんとかだと「私達の仕事を奪うんですか?」といったネガティブな反応からスタートすることも多かったです。ただ、あくまでも声をお預かりして、オファーに対する条件がマッチしたら使わせていただいて、その利用料をちゃんと還元していくというスキームについて、きちんとお話をすることで納得いただけるようになってきています。

―自分では受けきれない仕事を任せたり出来るようになりますよね。
それもそうですし、物理的にテクノロジーを使わないと出来ないこともあります。例えば「ゲームのキャラクターに名前を呼んで欲しい」というニーズはあるんですが、これまではパターンが膨大すぎるので実現出来ていなかったんです。コエステを使うことによって、このようにゲームのキャラクターに自分の名前を呼ばせることも可能になります。

―可能性の拡がりが本当に面白いですね。将来的にはどのようなチャレンジをしていきたいと考えていますか?
まずは、エイベックスと東芝の2社JVという形に閉じずにもう少し広げていきたいなと思っています。エイベックスとしてもそのオープンな戦略には寛容で前向きなので、とにかく早く拡大していくために、様々な事務所さんや広告代理店さん等のパートナーを巻き込んで、海外展開も進めていきたいです。

―国内で強力なパートナーシップを結んだ上で、海外展開も見据えていく展望ですね。
そうですね。多言語対応の実装に向けた技術側の整備は必要ですが、早々にオールジャパン体制のようなものを作って海外展開したい、という野望を持っています。

社内起業家としての働き方

―「社内起業家としての働き方」という観点で深堀っていきたいと思います。大企業発の新規事業として推進している中で、どのような点で苦労しましたか?
コエステについては、運良く皆が「良いね!」と言ってくれたから進められたのですが、仮に1人でも「絶対に無い!」と言ったら、そこで止まってた可能性があるんですよね。そこが社内起業の弱点だと思っています。
普通の起業であれば、ある意味スポンサーを選ばずに進められますよね。あのGoogleでさえも、最初は200社以上に投資を断られたという話があるくらいですから。

 ―構想が尖っているほど、なかなか皆が「良い」とは言ってくれないですよね。
そうなんです。ですので、本当に尖った新規事業を進めようと思ったら、まずルールを変えることから考えるべきだと思います。経営陣の10人中10人がOKを出さないと進められない仕組みではなく、1人でも賛同者がいたら進められるとか、仮に社内でダメでも外のVCに出資を募ることが出来るような仕組みとか。

―コエステは皆に共感してもらえたとのことですが、何か特別な工夫はされましたか?
僕としては、社内の人間は「仲間」だと思ってるので、斜めから変化球を投げたりせず、真正面からド直球で行くんですよ。僕自身は直球ですが、チームメンバーや支援してくれていた直属の上司の山田さんたちは、裏で色々と調整してくれていたんだと思います。

―あくまで正攻法で推進されたんですね。これまでのご経験の中で、大企業で新規事業を立ち上げる上では、どのような点が重要だと感じられていますか?
きちんとビジョンを立てて、縁を大事にすること、だと思います。やっぱり新規事業のような不確実性の高い仕事だと、ピンチって沢山あるんですよね。いくらでも途中で死ぬ可能性がある中で、これまでの縁で繋がっていた人が助けてくれたりするんですよ。
だから、人の縁はすごく大事にした方がいいし、縁を作るためには、ビジョンをしっかり持って「僕はこういう世界を作っていきたいんだ」という話をしっかり出来る必要がある。そのようなスタンスで活動していると、そこに手を差し伸べてくれる人も増えてくると思います。

―金子さん自身は今後、個人としてはどのようなキャリアビジョンを思い描いていらっしゃるんでしょうか?
やはり新規事業の立ち上げが好きなので、コエステを軌道に乗せたら、また何か新しい事業をやりたいと思っています。新規事業の立ち上げって、本当に何でもやらないといけないので大変な仕事ではあるのですが、そこに楽しさを感じています。今はまだコエステに全力投球ですけど。

―やっぱり金子さんは立ち上げ人なんですね。
そうですね。死ぬまでずっと、何か新しいものを立ち上げていたいなって思っています(笑)。

社内起業家へのメッセージ

―最後に、日々奮闘している社内起業家の方々、新規事業にチャレンジしたいと思っている人たちへのメッセージ、応援のアドバイスを頂戴できればと思います。
まずは、「傷の舐め合い」くらいでもいいので、仲間がいた方が良いと思います。それは社内でも社外でも良い。僕も挫けそうなときは同期に愚痴ったりもするんですが、「みんな苦労してるけど頑張ってるんだ」って思うだけで、自分もちょっと頑張れる。新規事業は辛いことも多いので、同士と言えるような仲間を作ることが重要かなと思っています。

あとは「録画の神」の片岡さんから教わった言葉なのですが「同じことを1000回言えるようになりなさい」 ということも大事だと思います。
やっぱり新規事業というのは、最初はなかなか周囲に理解されないもので、 多くの人はそのまま諦めてしまいます。ただ、何度も何度も、本当に顔を合わせるたびに同じことを言い続けていると、次第に理解されていって、応援してくれる人は必ず増えてきます。
本当に実現したいことがあるなら、その踏ん張りが重要ということを片岡さんから学びました。笑福亭鶴瓶さんや桂文枝さんも「一発ギャグもやり続ければ本当の芸になる。飽きてるのはお客さんじゃなくて自分自身だ」みたいなことを言っていて、少し通じるものを感じました。

「レグザの父」の本村さんからは「準備は周到に、本番は適当に」ということを教わりました。本村さんはレグザブランドを確立した立役者として、メディア戦略や全国の営業さんの士気を上げるのが非常に上手かったのですが、「そこまで必要ないんじゃないか」というくらい、あらゆる状況を想定して準備をして、本番を完璧にこなしていました。
僕も今では商談プレゼンや取材や講演など、膨大な数こなしていますが、毎回この言葉を思い出して準備をさぼらないようにしています。 「プレゼンうまいですよね」と褒めていただけることがありますが、単にしっかり準備しているだけです。「同じことを1000回言えるようになりなさい」「準備は周到に、本番は適当に」。この2つの言葉は僕も大事にしています。是非皆さんも意識してみていただければと思います。

編集後記

エイベックスと東芝デジタルソリューションズのJVで「コエステ」事業を推進する金子さんにお話を伺いました。

新規事業を推進するポイント/スタンスについて、非常に濃い新規事業開発の経験をされてきた金子さんだからこそのお話をお聞かせいただき、学べる部分が多いインタビューであったかと思います。

「声の新しいプラットフォーム」という大きな構想を掲げて事業開発を邁進する金子さんのチャレンジに、引き続き注目していきたいと思います。

(取材/編集:加藤 隼、永山 理子、執筆:中野 雅允、撮影:川上 裕太郎、デザイン:村木 淳之介)

2020-11-10|
関連記事