AIで音声を聞き取りやすくしてくれないものでしょうか

cre8tiveAIなるプラットフォームサービスがあります。
AIを利用して画像を高画質化することができるサービスです。
他にも画像内の不要な物を除去したりHDR化したり、フォトショップなどで人が作業していたことの自動化、といったことかと思います。 高解像度化についての記事があります。数時間かかる作業を10秒で。SaaSで画像を16倍に高解像度化できるAIツール

こうした画像に対する機能、サービスを見ていると音声についてもできるようにしないのかな、と思います。
既にAIスピーカーや翻訳機、テープ起こしなど音声を認識することはできる訳ですから、その認識した音声をきれいに、聞き取りやすくすることもできないのかな、と思う次第です。

私の場合、電話などがかかってきて、かけてきた方がよくかけてくる方であれば問題ないのですが、そうではなく、かつ、相手がはっきりと会社名や氏名を言ってくれない場合、聞き取れないことがよくあります。再度おっしゃっていただけるよう、頼んでも、同じように喋られるので結局、何と言っているのか分からず、失礼ながら何度も聞いてしまうことがあります。
でも、即座に音声を解析して補正した音声を受話器から返してくれると、そのようなことが無くせるのではないかと思うのです。

マイクやスピーカーなどを利用して大勢の前で話をする際なども、スピーカーが聞き取りやすいものに変換して出力してくれると助かるように思います。

最近は工場見学など体験を売りにするイベントもあるかと思います。
その際に、工場の方などが案内しながら、説明してくれることもあるかと思いますが、そうした時に、説明してくれる方から少し離れると聞き取りにくかったりすることもあるかと思いますが、そうした時にも便利かと思います。

スキー教室のような屋外での説明などでも力を発揮しそうですし。

どのようなものか詳細を知らないのですが、AIを利用した補聴器もあるようなのでできそうに思うのです。需要がどれほどあるのか分かりませんが。

更に言えば、聞き手の周囲の騒音に合わせて聞き取りやすい音声を出してくれるような機能にまで発展してもらえるとより良いですね。ノイズキャンセリングのようなイメージです。そうすれば館内放送などで有効でしょう。特に火災や地震といった非常事態時は生死を分けるかもしれないのですから。

また、聞き取る側の問題解決だけでなく、話す側の問題解決もできるように思います。
例えば、大きな声を出すことが難しい人や、何らかの理由で思うように発声できな人でも気軽に電話をかけられるようになったり。

とりあえず、ビジネス用の電話機などの新機能でどうでしょうか、と思います。NTTなんかできそうでに思いますけど。