一時的に視覚を失った状態でスマートスピーカーを使用する

一時的に視覚を失った状態でスマートスピーカーを使用する

あらゆるサイズのコンピューター画面は、何十年も私たちの生活に欠かせない存在でした。しかし、もし突然、それらの画面が使えなくなったらどうしますか? ネットにつながった生活スタイルを、どう維持するのでしょうか? 音だけでやりくりできるでしょうか?

2022年8月、セントポールのダウンタウンで自転車のコントロールを失い、宙に舞い上がり、ヘルメットをかぶった頭をアスファルトに叩きつけ、ひどい衝撃音を立てました。ひどい脳震盪を起こし、その後すぐに、私の世界は暗闇に包まれ始めました。

私は極度の羞明に苦しんでいました。これは一種の光不耐性で、周囲の光が眼窩にナイフを突き刺されたように感じるのです。これは脳震盪の一般的な副作用であることが判明し、数ヶ月にわたって私が経験した数々の症状の一つでした。症状が悪化し、痛みを和らげるために常にアイマスクを着用するようになった時、私は自分が事実上失明してしまったことに気づきました。

普段は一日中使っている情報、交流、エンターテイメントを、コンピューター機器を使って利用できなくなるかもしれないと思うと、パニックになりました。視覚障がいのある人が長年MacやiOSデバイスを操作できるようにしてきたVoiceOverの使い方を知りたいと思いました。しかし、視覚障がいのある状態でその複雑な操作をマスターするのは無理だと感じました。もっと速くてシンプルなものが必要だったので、音声アシスタントを内蔵したスマートスピーカーに頼ることにしました。

当時、私の音声制御ガジェットのコレクションには、Siri搭載のHomePod miniスピーカー2台、Googleアシスタント搭載のGoogle HomeとNestスピーカー数台、そしてAmazon Alexa搭載のAmazon EchoとMeta Portalデバイス各種が含まれていました。その後、HomePod miniの代わりに、Appleが最近発売したフルサイズの第2世代HomePodを2台購入しました。

ジュリオのスマートスピーカーコレクション
スマート ディスプレイ (左から右へ): Meta Portal Go、Google Nest Hub Max、Meta Portal Plus、Amazon Echo Show 8。スマート スピーカー (左から右へ): Apple HomePod、HomePod mini、Google Home Mini、Amazon Echo Dot、HomePod mini、Google Nest Audio、HomePod。

それまでのスピーカーの使い方は、タイマーの設定、サーモスタットの調整、照明のオン/オフ、AirPlay による音楽の再生など、単純なものでした。

これらは一種のスクリーンレスコンピューターだと考え、もう使えなくなったスクリーン付きガジェットの代わりを、どの程度果たせるだろうかと考えた。もしかしたら、精神病を除けばHAL 9000、映画『her/世界でひとつの彼女』のサマンサ、マーベル・シネマティック・ユニバースのジャーヴィスのような存在になれるかもしれない。

ネタバレ注意: スマートスピーカーはまだかなり愚かです。

私はこのストーリーを、ポッドキャスト、ニュース、音声通話、音楽、書籍、Web 検索というカテゴリーに分類しました。それぞれのカテゴリーは、私がスマート スピーカーで再現しようと試みたコンピューターの使用法を表していますが、成功の度合いはさまざまです。

ウェブ検索のカテゴリーが特に重要だったのは、私が自分の病気について詳しい情報を切実に求めていたのに対し、家族が私を探すのに費やす時間と忍耐力には限りがあったからです。音声アシスタントは、後述する理由により、役に立たない代物でした。

これらはすべて、OpenAIのChatGPTのようなAIチャットボットが広く普及する数ヶ月前に起こった。ChatGPTは人間のようなインタラクションを可能にし、必ずしも正確ではないにしても、より網羅的に情報を掘り出すことができるようになった。スマートスピーカーへの影響は明らかだ。

スマートスピーカーをテストする際、HomePodと競合製品を比較したかったのです。HomePodはいくつかの点で優れている一方で、他のカテゴリーでは期待外れでした。

AmazonとGoogleのスマートスピーカーは、HomePodとは重要な点で異なります。AmazonとGoogleのスマートスピーカーは、インターネットに直接接続することで、より自律的に動作するのに対し、Appleのスピーカーは、主にiPhoneをはじめとする他のApple製ハードウェアの拡張機能として機能する傾向があります。これは、時として決定的な違いとなることが証明されました。

AmazonとGoogleは、スマートディスプレイ(画面が組み込まれたスマートスピーカー)の提供においても違いがあります。Appleはそのような製品を提供していません。これは残念です。なぜなら、私のGoogle Nest Hub MaxとAmazon Echo Show 8は、画面のない同種の製品ではできなかったような便利さを発揮してくれたからです。

以下の内容は、スマートスピーカーの音楽以外の用途に関する私の以前の記事(「音楽を超えて:HomePodとAmazon EchoおよびGoogle Homeを比較」、2018年3月15日参照)と似ていますが、詳細が更新され、私の病状にさらに特化しています。

5年経った今、スマートスピーカーがほとんど変わっていないことに驚かされます。

ポッドキャスト

OvercastやPocket CastsといったiPhoneのポッドキャストアグリゲーターアプリは、自分が何をしているのか見えないため使いにくくなっていました。幸いなことに、スマートスピーカーが十分に代替品になりました。

私のニーズはそれほど複雑ではありませんでした。お気に入りのポッドキャストのリストを頭の中で思い浮かべながら、AmazonとGoogleのスピーカーに「MacBreak Weeklyを再生して」といったコマンドを出しました。すると、Amazon MusicとGoogle Podcastsサービス経由で、レオ・ラポルテのApple中心の番組の最新エピソードが確実に再生されました。Amazonでは、TuneIn、iHeart、Apple Podcastsといった他のサービスを再生のデフォルトとして指定できますし、GoogleではSpotifyをそのタスクに割り当てることができます。

私の HomePod の体験も同様でしたが、間違った場所を検索してポッドキャストのエピソードではなく音楽トラックを提供しないように、音声コマンドにポッドキャストのソースへの参照(「Apple Podcasts から Planet Money を再生」)を追加する必要がありました。

時間が余っていたので、ポッドキャストの過去のエピソードを掘り下げて聴いてみたくなりました。AmazonとGoogleのデバイスで「前のエピソードを再生」コマンドを使えば、ある程度はそれが可能になりました。Amazon MusicやGoogle Podcastsを使えば、どのポッドキャストでも最新の10エピソードを聴くことができました。お気に入りの番組に追いつくには、これは素晴らしい方法でした。

HomePodではそうではありませんでした。過去のエピソードをリクエストすると、Siriは「申し訳ありませんが、戻ることができませんでした」と返答しました。さらに悪いことに、私のリクエストは時々「申し訳ありませんが、Apple Podcastsに問題が発生しています」というエラーを引き起こすこともありました。(公平を期すために言うと、どのスピーカーも様々な理由で不可解なエラーメッセージを定期的に返していました。)

HomePodでポッドキャストにアクセスするには、iPhoneのポッドキャストアプリに組み込まれているSiriショートカットを使う方法もあります。Overcastでは、「Overcast お気に入り」と言えば、お気に入りのポッドキャストエピソードリストの一番上にすぐに移動できます。同様に、Pocket Castsでも、数語言うだけで「お気に入り」や「進行中」といったポッドキャストやポッドキャストフィルターにアクセスできます。

しかし、幕が下りる頃にはSiriのショートカットをほとんど覚えていなかったので、この方法にはあまり頼りませんでした。それに、HomePodがコマンドを実行する前にiPhoneにログインするように要求してくることがあり、本来の目的を果たせませんでした。

ニュース

私はニュース中毒で、ナショナル・パブリック・ラジオとその系列局ミネソタ・パブリック・ラジオの音声版をよく聴いています。そのコンテンツの多くは、先ほどお話ししたポッドキャストとして提供されています。

しかし、時々、KNOW(MPRのニュースチャンネル)のライブ音声フィードを聞きたい時がありました。「ミネソタ・パブリック・ラジオを再生」「MPRニュースを再生」「KNOWを再生」といったフレーズを試してみました。なぜなら、これらの単語の組み合わせを全ての人が同じように理解するわけではないからです。例えば、Googleは「ミネソタ・パブリック・ラジオを再生」をMPRのポピュラー音楽局「The Current」と誤認識することがありました。

定期的に更新されるニュース速報もすぐに利用できました。HomePodでは、「ニュースを教えて」と言えば、NPR News Nowの最新の1時間ごとの録音が流れてきました。公共ラジオが苦手な人のために、AppleはCNNやFox Newsなど、他のニュース速報ソースも提供しています。「切り替えて…」という音声コマンドで、ニュースソースをデフォルトに設定できます。

AmazonとGoogleのユーザーは、CNN、PBS、ニューヨーク・タイムズなど、様々なニュースソースからニュース速報をまとめて順番に再生するなど、より高度な機能も利用できます。Alexaアプリでは「マイニュースチャンネル」、Google Homeアプリでは「ニュースソース」を設定できます。どちらの場合も、「ニュースを教えて」などのフレーズで速報が開始されます。幸い、私は自転車事故に遭う前にこれらの設定を済ませていました。

残念ながら、Apple の世界にはこれと同じようなものはありません。少なくとも、「音楽を超えて: HomePod と Amazon Echo、Google Home を比較する」で説明した面倒なポッドキャスト「ステーション」設定がなければ。

療養中の私の究極のニュース目標は、NPR Oneをスマートスピーカーで使えるようにすることでした。これまで一度もそんなことが必要になったことはありませんでした。「NPR One」とは、数十もの公共ラジオ番組やポッドキャストのニュースを、ユーザーの好みに合わせて無限にストリーミング配信する、カスタマイズ可能なサービス(モバイルアプリとウェブアプリ)のことです。私のようなNPR中毒者にとって、NPR Oneはまさにニュースの聖杯です。

このサービスはAmazonスピーカーでのみネイティブ対応している点が残念でした。NPR Alexaスキルをインストールすれば(私は家族の助けを借りてインストールしました)、NPRを再生できます。この文脈ではNPR Oneとは呼ばれていませんが、「アレクサ、NPRを再生して」とコマンドで起動すると、NPR Oneと同じように動作します。

NPRはスマートスピーカーへの対応に多大な努力を払ってきましたが、NPR Oneに関してはAppleとGoogleのスピーカーではうまく機能していないようです。Apple製品では、NPR OneはApple TVとCarPlayでは動作しますが、HomePodでは動作しません。Google製品では、Android Wear(GoogleのスマートウォッチOS)とAndroid Autoはサポートしていますが、私のGoogle Home MiniやNest Audioスピーカーでは動作しません。

音声通話

電話の発信と着信に関しては、Appleは私の期待を裏切らない対応をしてくれました。HomePodをスピーカーフォンとして長年使っていたので、これは当然のことでした。

この点において、HomePodは私にとって最大の慰めの一つでした。孤独に打ちひしがれ、友人や家族の声を切望していたからです。連絡先に登録してある電話番号は、「電話をかける」という簡単な指示ですぐに呼び出すことができました。

もちろん、HomePodは単体ではそのような通話は行いません。近くにiPhoneがあれば通話が可能で、FaceTime通話にはiPadかiPhoneが必要です。しかし、この設定は非常にスムーズだったので、他の方法を考える必要はありませんでした。

Amazon と Google もスピーカー経由で音声通話を許可していますが、実装はそれほど洗練されておらず、制限もあります。

Amazonユーザーは、Echoハードウェア経由で最大10件の携帯電話または固定電話番号を設定できます。電話をかけると、Alexaアプリで確認・編集できるAlexa-to-Phoneリストに番号が追加されます。米国、英国、カナダ、メキシコ以外の国を含む一部の番号は利用できません。

Amazonは、Echoスピーカーから他のEchoスピーカー、またはAlexaアプリをインストールした電話に直接電話をかける機能も提供しています。最近では、AT&T、T-Mobile、Verizonのユーザーが、関連スキルを介して携帯電話番号をAlexaアカウントに紐付け、ハンズフリー通話を利用できるようにしました。このアプローチは、HomePodの音声通話とほぼ同等です。

Googleユーザーは、スピーカーを使っていくつかの方法で通話できます。キャリア通話はGoogle VoiceまたはGoogle Fiアカウントを利用する方法です。Googleがサポートする通話は、アカウントを必要としません。カナダと米国(米国領土を除く)への通話のみサポートされています。

Google の Meet メッセージング サービスでは、コンピューターやモバイル デバイスだけでなく、Google スピーカー間での通話も可能になります。

音楽

音楽を簡単に手に入れる方法を探していた時、ほんの数ヶ月前にApple MusicのSiri専用版に登録していたことを嬉しく思いました(2022年1月3日の記事「Siriを使いこなせるならApple Musicの音声通話プランはお得」参照)。私の状況にぴったりだったので、他の選択肢についてはあまり悩まなかったのです。

私のレビューで述べたように:

リリース以来、月額4.99ドルのApple Music Voice Planを使っていますが、Siriが私の音楽リクエストに驚くほど的確に対応してくれることに気づきました。Voice Planのおかげで、Siri中心の音楽サービスは、特定のタイプの人にとっては良い選択肢になり得ると確信しました。驚いたことに、Siri経由でApple Musicを使うのが楽しくて…このまま使い続けるかもしれません。

今となっては「ある種の人々」という言葉を笑いたくなる。羞明で目が見えなくなった私は、医学的な意図は全くなかったにもかかわらず、そんな人間になってしまったのだ。

Apple製品以外のスピーカーも時々使っていました。私はPandoraの会員で、AmazonとGoogleのスピーカーで音楽を再生する際は、Amazon MusicやYouTube Musicではなく、Pandoraをデフォルトに指定しています。療養中もPandoraが使える状態だったのはありがたかったです。

Apple MusicはAmazonとGoogleのスピーカーでも利用可能ですが、月額4.99ドルのVoiceプランではなく、月額10.99ドルのフルバージョンのみ利用可能です。Deezer、iHeart、Spotifyなどの他の音楽サービスは、どちらのプラットフォームでも利用可能です。Amazonは9つのオプション、Googleは6つのオプションを提供しています。

HomePod は、Pandora と Deezer など、サポートする音楽サービスが少なく、Apple Music の代わりに音楽のデフォルトとして指定できます。

光恐怖症になるまでは、オーディオブックを聴くことはほとんどなく、紙媒体や電子書籍を好んでいました。しかし、オーディオブックは所有しており、それが唯一の実用的な読書手段だった頃には、オーディオブックを熱望するようになりました。

Appleは私を失望させました。HomePodのApple Booksライブラリにあるオーディオブックを音声コマンドでキューに追加することはできません。私のような一時的な障害を持たない人なら、iPhoneのAirPlayなどを使って再生できたでしょうが、私には現実的ではありませんでした。この制限は、Apple Booksで購入したオーディオブックだけでなく、Amazon Audibleアカウントから同期したオーディオブックにも適用されます。

コーマック・マッカーシーのディストピア小説『ザ・ロード』をApple Booksで読みたくてたまらなくなり、iPhoneのブックアプリを盲目的にタップするしかなかったが、あまりうまくいかなかった。Siriに「ザ・ロードを再生して」と頼むと、『Halo Infinite』のサウンドトラックからギャレス・コーカーのスリリングな音楽が流れてきたのは確かに嬉しかった(1999年のスティーブ・ジョブズの基調講演でApple CEOがHaloのビデオゲームを世界に発表した時のことを彷彿とさせる)。しかし、それは私が求めていたものではなかった。

それに比べ、Amazonはオーディオブックの再生を非常にスムーズにしました。Alexaに「Sailing to Byzantiumを読んで」と頼むと、ロバート・シルヴァーバーグのSF小説がすぐに再生されました。しばらくして「続きを読んで」と発声すると、中断したところから再生が始まりました。Audibleでは、Alexaコマンドで他にもたくさんの機能が利用可能です。

Googleオーディオブックの再生も同様に機能しましたが、信頼性は低かったです。Amazonと同様に、私のGoogleブックライブラリはクラウド上に保存されており、直感的なコマンドでアクセスできます。例えば、「Rise of the Dragons: Kings and Sorcerers」と言えば、魅力的なファンタジー小説を読み始めることができ、「私の本を読んで」と言えば、読んでいる本の続きを読むことができます。しかし、Googleアシスタントはライブラリ内の一部のタイトルを見つけられず、私が本を尋ねても「申し訳ありませんが、理解できませんでした」としか返答しないこともありました。

残念ながら、いつも電子書籍とオーディオブックを入手しているLibbyアプリを諦めざるを得なかった。このアプリは公共図書館への貸出ポータルとして機能する(「図書館に行かずに、自宅で電子書籍などを借りよう」2020年9月14日記事参照)。私の目は見えないので、VoiceOver以外にLibbyを操作する明確な方法は見当たらなかった。例えば、LibbyにはSiriショートカットがあらかじめ用意されていないようだ。Siriショートカットがあれば、オーディオブックの選択肢が飛躍的に増えたはずなのに、本当に残念だ。

ウェブ検索

Google検索へのアクセスは、間違いなく最も重要な項目でした。暗闇に閉じ込められた私は、自分の病状について疑問が溢れかえっていたにもかかわらず、いつものようにMacやiPadで深く調べる余裕がなかったからです。家族に何時間もGoogle検索の代理を務めてもらうのは、あまりにも負担が大きすぎたでしょう。

そこで私は、脳震盪とその副作用について、講演者たちに次々と質問を投げかけました。私の場合は、脳のもやもや感、バランス感覚の低下、そして全身の抑えきれない痙攣など、様々な症状がありました。これらはすべて脳震盪後症候群の兆候で、多くの人が経験するように、数週間以内に脳震盪から回復しなかった私が経験した症状です。

講演者たちの力はほとんど役に立たないことがすぐに明らかになった。回答を読み上げてもらう必要はあったが、実際に読み上げられるのはWikipediaや医療ウェブサイトから得た、満足のいくものではない断片的な情報ばかりだった。フォローアップの手段もなく、追加情報を要求しても困惑した反応しか返ってこなかった。

私の HomePod は、結果をまったく読み上げず、代わりに iPhone でクエリを再現して Web の結果を読むように指示することがよくありましたが、これは明らかに私には不可能で、まったくイライラさせられました。

Googleのスピーカーは、二段階の回答を提供してくれたので、とても助かりました。私の質問に答えた後、他のユーザーからよく寄せられる関連する質問を提案してくれました。「それを聞きたいですか?」と尋ねれば、答えを教えてくれました。

たとえば、私が「光恐怖症とは何ですか?」と尋ねると、Google アシスタントは応答し、他の人が「光恐怖症の治療法はありますか?」と尋ねたことを親切に教えてくれます。

これは問題ありませんでしたが、繰り返しになりますが、私は情報を少しずつ与えられており、それをさらに深く調べたり、情報源を選択したり、精査したりすることはできませんでした。

この制限をある程度回避する方法がありました。GoogleのNest Hub Maxには画面があり、YouTubeコンテンツを再生できるので、自分の研究テーマに関する動画をリクエストしても、音声だけを聞くことができました。デバイスに「脳震盪後症候群に関する動画を再生して」と頼むと、この障害についてちょっとした速習講座を受けることができました。そして、「OK Google、次へ」と言えば、動画を次から次へと無限に切り替えていくことができました。

画面付きのAmazonデバイス、Echo Show 8とMeta Portalは、それほど役に立ちませんでした。Echo Showでは、Alexaに特定のトピックに関する動画をリクエストできましたが、Bing検索を経由してDailyMotionのウェブサイトに飛ばされ、音声ナビゲーションオプションはなく、最初の動画の後にコンテンツが話題から逸れていく傾向がありました。Meta Portalでは、これらの機能は全く機能しませんでした。

しかし、GoogleのNest Hub Maxでさえ満足のいくものではありませんでした。なぜなら、ほとんどコントロールできない連続した動画の旅を強いられ、時には役に立つ動画にたどり着くまでに12本以上の役に立たない動画を視聴させられることもあったからです。Macでは、動画のサムネイル画面をじっくり見て、最も役に立つ動画に絞り込むだけで済みました。しかし、このスピーカーはスマートではありません。

複雑な探究の道筋を人間のような会話で導いてくれるアシスタントが必要でした。ナレッジナビゲーターのような、アシスタントを内蔵したiPadのようなデバイスが必要でした。これは当時のApple CEO、ジョン・スカリーが1980年代後半に構想し、コンセプトビデオでデモを行ったものです。あるビデオでは、蝶ネクタイを締めた執事のようなアシスタントが、教授の命令を多様かつ複雑にこなす様子が描かれていました。

SiriGPT?

残念なことに、私の事故と回復は、OpenAI の ChatGPT、Microsoft の Bing (ChatGPT のバージョンを使用)、Google の Bard などのチャットボットのおかげで現在テクノロジーの世界を席巻している人工知能ブームの数ヶ月前に起こりました。

これらのチャットボットは、ユーザーの状況や意図に基づいて、目もくらむような複雑なリクエストに応えながら自然言語を理解・生成する点で、従来の検索エンジンとは異なります。詩を作ったり、コードをデバッグしたり、旅行プランを作成したり、小売店の買い物を提案したり、利用可能な材料に基づいてレシピを提供したり、動画やテキストを要約したり、言語を翻訳したり、その他多くの機能を提供します(「ChatGPT:AIの未来はここに」2022年12月9日号参照)。

Bingに「脳震盪後症候群から回復するための段階的な医療計画を書いて」といった指示を出すと、療養中だった私ならきっと喜んでいたであろう詳細な回答が返ってくる。しかも、iOSアプリ版のBingはデフォルトで音声検索を受け付け、回答を読み上げてくれるので、音声でリクエストを言うこともできる。数ヶ月にわたる暗闇の中で、これは奇跡だっただろう。

私が何を言いたいのかお分かりでしょう。スマートスピーカーに搭載されているアシスタントは、適切な場面でChatGPTのように機能する必要があります。そうであれば、私のスピーカー体験は飛躍的に向上していたでしょう。ChatGPTが今のように、一つの質問が次の質問へと繋がり、さらにまた次の質問へと繋がるような、オープンエンドの会話ができたはずです。

暗い時期にスピーカーから聞こえてきた、満足のいかない医療情報の断片ではなく、音声プロンプトを理解できればウェブサイト全体の内容を抽出できたはずです。ChatGPTが提供してくれたデータが正確だと仮定すれば(よく知られているように、ChatGPTは正確ではないことが多い)、脳震盪の専門家になっていたかもしれません。無知による不安から逃れられたかもしれません。今の知識があれば、もっと早く回復できたかもしれません。

例えば、私は光恐怖症による激しい痛みは光が身体にダメージを与える可能性があるという誤った思い込みに基づいて手術を受けていました。そして、そのようなダメージを防ぐ唯一の方法は、四六時中アイマスクを着けて身を隠すことだと考えていました。しかし、外傷性脳損傷の専門医は、痛みは必ずしもダメージではないことを教えてくれました。そして、光が気にならないようになるまで、意図的に少しずつ光にさらしていくことが、症状の改善に繋がる唯一の方法だと教えてくれました。実際にそうしたところ、症状は急速に改善しました。もっと早くこの情報を知っていればよかった!

AIチャットボットは、SiriやiOS、macOSの幅広いエコシステムと適切に統合されていれば、私が挙げたあらゆる分野で大きな変化をもたらす可能性があった。ポッドキャストのバックカタログを隅々まで探したり、どんな言い回しでもKNOWのライブフィードを再生したり、NPR Oneを設定したり、Apple Booksで購入したオーディオブックを再生したり、といったことも難なくこなしてくれただろう。

Macworldのダン・モレン氏は、こうした改善の必要性を力説しています。Cult of Macのエド・ハーディ氏も、「SiriにはChatGPTのような知能が切実に必要だ」と題した記事で同様の主張を展開しています。

意欲的な iOS ユーザーは、ある程度までこれを実現していますが、Apple は公式実装を進める必要があります。

今では、ティータイマーの設定、天気予報の確認、AirPlay経由でスマートフォンからポッドキャストを再生、Nestサーモスタットの温度調整など、簡単な操作にスピーカーを使うようになりました。スマートスピーカーをもっと生活に欠かせないものにしようと試みましたが、AIの勉強を再開するまでは、あまり意味がないように思えます。現状では、スマートスピーカーにできることは限られています。

Idfte
Contributing writer at Idfte. Passionate about sharing knowledge and keeping readers informed.