SSブログ

「ドラゴンスピーチ11 (Dragon Speech 11)」ブロガーミーティング参加 : 手放しでブログが書けるなんて! [ガジェット : 面白いもの色々]

2014-05-30 22.17.23.jpg

★ Dragon Speech 11とは

音声認識・音声入力ソフト ドラゴンスピーチ のイベントに参加しました。
世界シェアNo.1の音声認識・音声入力ソフト ドラゴンスピーチ11は、Nuance社が97年に開発・販売を開始した製品です。それから十数年の歴史を重ね、今はバージョン11になっています。今回はその一般向け製品の紹介を受けたのですが、OEMとしてはトヨタのカーナビやパナソニックのビエラの音声操作用ソフトとして組み込まれているのだとか。もう既に、知らない間にお世話になっていたかもしれません。
音声認識ソフトというと、Googleの音声認識による検索や、AppleのSiriDoCoMoのしゃべってコンシェルなどで、最近はとても身近なものになってきました。認識率もかなり高いですよね。まさに"実用レベル"に達しています。そんな音声認識ソフトの先駆けがこのDragon Speech。期待できそうって感じはイベント参加前からしていたんですが、今回の実演などを見て確信に変わりました。これは使える!

さて、そのDragon Speech 11はどんなものなのか、まずは概要説明。
説明してくれた方がなかなか"個性豊か"な方で、堅い話も楽しく、そして分かり易く解説してくれたので助かりました。
IMG_0627.jpg

特徴としては、
  • MS-Windows 7 / 8 / 8.1 互換アプリケーション:音声コマンドによってWindows 8.1のデスクトップやチャームをコントロール可能
  • 自動音声認識アプリケーションソフトウェア市場で世界シェアNo.1
  • 日本語版の音声認識用辞書登録語数は約100万語 : 追加登録も可能
などなど。
IMG_0629.jpg

特徴的で、これは便利そうと思ったのが「口述録音ファイルを高速文字化」する機能。レコーダーに吹き込んだ音声データ(mp3フォーマットなど)を読み込ませて、一気に文字に変換してくれるんです。音声認識ソフトというと、その場でマイクにしゃべったものを逐語訳的に対応してくれるもの、と言うイメージがあったのですが、貯めて置いた物に対応してくれるのはとてもいい!レコーダーにブログの下書きやら、物書きの人だったら原稿やらを吹き込んでおいて、それを後から文字にしてくれる訳です。これならば(独り言をブツブツ言っていても大丈夫な場所であれば、、、の制限付きですが?!)どこでも文章の下書きが作れるんですから。

使用するマイクもそうなのですが、レコーダーに関しても音質がある程度良いものが望まれる(ちゃんと認識できる)ということで、Dragon Speech 11では推奨品が(つまりはNUANCE社で適合テストをしてあるということ)ホームページに載っています
OLYMPUS ICレコーダー VoiceTrek 8GB リニアPCM対応 MicroSD対応 BLK ブラック V-823、もしくはGLD ゴールドがそれ。今回のイベントでもオリンパスの方もいらっしゃっていて、デモを拝見しました。

IMG_0630.jpg

Dragon Speech 11自体は、mp3などの音声ファイルであればなんでも読み込むことはできるそうです。ただ、音質によって認識率に差が出てしまうので、このような推奨品を定めている訳です。実際、スマートフォンに標準で付いているボイスレコーダーでも可能とのこと。試してみたいと思います。
なぜかAndroid版はないのですが(是非、よろしく!)、iOS版ではNUANCE社が専用レコーダーアプリを提供しているので、それを利用するのがいいでしょう。
ちなみにAndroidでは、スマホを"ワイヤレス・マイク"として使うアプリは出ているんですけどね。記録できないのであまり出番はなさそう。

さて、Dragon Speech 11ができるのは口述筆記だけではありません。音声でパソコン操作・アプリケーション操作ができてしまいます。MS-OfficeのWordやExcel、PowerPointなどのために、事前登録されたコマンド(操作するための"台詞"集)が用意されていますし、自分で作成・登録も可能です。
VBスクリプトで本格的にスクリプトを組むこともできますし、より簡単な方法としては操作手順(ボタンをクリックしたり、入力したり)を記録することでもコマンドを作れるんです。
IMG_0631.jpg

こちらはVBスクリプトでコマンドを組む実演。知っている人はこれで色んなことができそうです。
そうでなくても、操作手順記録式でも、PowerPointで「スライドショー開始!」なんて台詞に対してスライドショー開始ボタンを割り付ければ簡単にできてしまいます。これなんか実用的ですよね。
IMG_0638.jpg

★ ブロガーによる体験談

後半はユーザー代表の体験談と言うことで、Lifehacking.jpの堀さんご登壇。研究者としての仕事と、育児に追われる中、Dragon Speechを使って口述録音によるブログ(の下書き)作成をしているそうです。完璧な文章を求めず、あくまで下書きだそうですが、それでも育児で疲れた後にブログ記事を一から書き始めるよりも"精神的に"大きな違いがあるとか。確かにそうですね。疲れているときには最初の一言を書き出すのが大変。でも、(多少、変換ミスがあっても)本文がある程度出来上がっていれば気分的には大きな違いがあります。なるほど、堀さんのライフハッキング術の秘密を見た気がしました。
IMG_0645.jpg

今はこのDragon Speech 11を"育てる"のも楽しみの一つになっているとか。日に二、三語でもいいから新しい言葉を覚えさせていくと、さらにさらに使い易く、使えるツールになっていくのでした。
さすがですね。もう、PFUの新しいスキャナー(?)、SnapLiteを登録されていました。
IMG_0659.jpg

★ プロファイル登録実演

Dragon Speech 11は、一人一人の声質に合わせてプロファイルを個別に作成、チューニングがされていくようになっています。その際には使うマイクやら、その接続方法(USBなのか、Bluetoothなのか)も指定します。そうやって、その音質にぴったり合うように設定がされていくんですね。
ということで、Dragon Speech 11をインストールすると、最初に自分(の環境)用のプロファイルを作ることになります。その実演としてWADA-blog(わだぶろぐ)の和田さん登壇。
和田さんは昔、Dragon Speechのユーザーだったそうです。腱鞘炎と目の病気になり、パソコンに向かって仕事ができなくなってしまったとき、このDragon Speech(Ver.7の時代だそうです)を使い出したのだとか。
なので、慣れてはいたのでしょうけど、和田さんがしゃべる言葉は全てちゃんと変換されていました。和田さんが凄いのかもしれませんが、Dragon Speech 11が賢いからなのでしょう。
IMG_0671.jpg


プロファイル作成時には、マイクの種類や接続方法、性別や年代などをまず入力します。そして次にテスト用の文章がこのように表示されるので、それを読み上げます。ここでマイクの音量やら何やらをチェックするそうです。
ここまでやればプロファイルは作成でき、もう使い始められます。慣れている和田さんだと、これだけでもう、誤変換なくすらすらDragon Speech 11を使いこなしていました。

さらに最初にDragon Speech 11を"トレーニング"させるため、30分ほどかかるそうですがテスト文章も用意されていました。気持ちよく使うにはこれをやっておくのがおすすめだそうです。
IMG_0679.jpg


それにしても音声認識ソフト、進化が凄い。これならばブログを書くのがとっても楽になりそうです。
そしてそして、このイベントに参加した人には一本ずつ、Dragon Speech 11がプレゼントされたのでありました!と言う訳で、私も口述録音によるブログ執筆に挑戦していきたいと思います。その様子はまた報告します。

と言いつつ、早速使っていて、このブログ記事の一部もDragon Speech 11で入力してます。これ、本当に使えますよ!凄い!

このイベントに参加された皆さんのブログ一覧です。


Amazon.co.jpで購入する
楽天市場で購入する





SnapLite PD-SL01
B00KA3KW00 Amazon.co.jpで購入する
楽天市場で購入する


nice!(9)  コメント(0)  トラックバック(0) 

nice! 9

コメント 0

コメントを書く

お名前:[必須]
URL:[必須]
コメント:
画像認証:
下の画像に表示されている文字を入力してください。

Facebook コメント

トラックバック 0

この広告は前回の更新から一定期間経過したブログに表示されています。更新すると自動で解除されます。