はじめまして、CI事業部の金子です。 初めてのブログ投稿です。よろしくお願いします。
Re:Invent Day3はAWSのCEO、Andy Jassyのキーノートセッションがありました。我々も4人で早起きして出席、新発表を楽しみました。
発表内容が充実しているのはもちろんですが、演出も凝っており、各分野の発表は「エンジニアが求めているものは何か? を、ロックの名曲のバンド演奏&歌詞の引用で表現→歌詞につなげる形でAndyが話を始める」という形式で統一されており、茶目っ気を感じました。例えば、データベース分野の始まりは次の通り:
- ビートルズの「Blackbird」をバンドが演奏
- スクリーンでは夕焼け空を飛ぶブラックバードの映像が流れる
- 演奏の終わりに合わせて歌詞の一部が画面に大きく表示される。「TO BE FREE」・・・
- Andyが歌詞を音読した上で、話し始める。「この曲が何について歌っているのか、それは明らかだ。そう、『データベース・フリーダム』!・・・」
このように、単にスライドを表示するだけではなく、ムービー、音楽、照明を組み合わせた総合的な演出がなされており、技術カンファレンスと言うよりも音楽フェスのような盛り上がりがありました。そのおかげもあり、3時間と言う長丁場の発表でしたが、飽きずに聞くことができました。
例年通り、多数の新サービス、新機能が発表されたので、すべてはご紹介できませんが、気になったものをいくつかピックアップしてみます。
Amazon Timestream
時系列データ向けに設計された、マネージドなDBのサービスです。従来の時系列データを扱う開発には、次のようなジレンマがありました。
・従来の形式のDB(リレーショナルDB、キーバリューストア)には高い信頼性、拡張性があるが、時系列データ向けに最適化されていない。
・一方で、時系列データ向けに設計されたDBを使おうとした場合、時系列データ向けの機能は充実しているものの、エンタープライズレベルの可用性や信頼性を満たせるものはない。
↓
そのため、いずれを採用した場合でも、DBに不足している部分を自力で埋める必要がある。
これらを解決するのがAmazon Timestreamです。時系列データ向けの設計でありながら、高い信頼性、拡張性も併せ持ち、おまけにコストも安いということなので、大量の時系列データを扱うシステム(IoTなど)の開発に「データベース・フリーダム」をもたらしてくれるのではないでしょうか。
Amazon Textract
一言で表すと書類のOCRサービスなのですが、従来のOCRと違うのは、書類の形式を自動で解析し、データを構造化してくれる点です。例えば、下記のような入力欄を考えます:
┌――┬――――――┐ |氏名|フレクト太郎|※住所は○月○日現在の |住所|東京都中央区| ものを記入して下さい └――┴――――――┘
これを従来のOCRで読み込んだ場合、そのままだと純粋に文字のみを抽出するため「氏名フレクト太郎※住所は○月○日現在の」「住所東京都中央区ものを記入して下さい」の2行として読み込まれてしまうという問題がありました。これを回避するには、書類ごとに個別の作業が必要となってしまっていました。その点、Amazon Textractは書類の入力フォームを自動で判断し、「氏名:フレクト太郎」「住所:東京都中央区」の2つを適切に抽出してくれるそうです。OCRの世界に革命が起きるのではないでしょうか(ただ、日本語への対応状況が気になるところではありますが・・・)。
Amazon Personalize, Amazon Forecast
類似のサービスのため、まとめて触れます。
Personalize、Forecastはそれぞれその名の通り、パーソナライズ、未来予測のAPIを作成できるサービスです。もちろんAPI作成には機械学習を利用しているのですが、ポイントは、ユーザには機械学習の知識は不要であり、データを準備するだけで良いということです。
機械学習もコモディティ化が進んでおり、マネージドなサービスでカバーできる範囲が徐々に広がっているという印象を強く受けました。
・・・
キーノートの後は、エンジニア3人で集まってランチを頂きました。
話題に上ったのは、Day 3のキーノートでは、コンテナ、サーバーレス関連の発表が無かったこと。Day 4にはAWSのCTO、Dr. Werner Vogelsのキーノートがあるので、そちらで何か発表があるのではないかと思っています。このブログでDay 4についてもレポートしますので、お楽しみに!