編集長– Author –
-
データベース・データ管理
CockroachDB — Spanner思想を継ぐ分散SQLデータベース
CockroachDBは、Googleを離れた元エンジニアSpencer Kimball、Peter Mattis、Ben Darnellの3人が2015年に公開した分散SQLデータベースです。Google Spannerの2012年論文を強く意識した設計で、PostgreSQL互換のワイヤープロトコルを採用しながら、地理分散... -
データベース・データ管理
ClickHouse — Yandex生まれの列指向OLAP超高速エンジン
ClickHouseは、ロシアの検索大手Yandexが2009年から社内開発し、2016年6月にApache 2.0ライセンスでOSS化した列指向DBMSです。ウェブ解析サービスYandex.Metricaの数兆行を捌くために設計されており、単一サーバでも秒間数億行のスキャンを実現します。Clo... -
データベース・データ管理
Neo4j — 関係そのものを格納するグラフデータベース
Neo4jは、2007年にスウェーデンのスタートアップ Neo Technology(現Neo4j, Inc.)が公開したグラフデータベースの草分けです。ノードとリレーションシップを一級市民として保存し、SQLライクな問い合わせ言語 Cypher で「関係を辿る」操作を直感的に書け... -
データベース・データ管理
DynamoDB — AWSが運用ごと提供するサーバーレスNoSQL
Amazon DynamoDBは、2012年にAWSが公開したフルマネージド型のキーバリュー/ドキュメントNoSQLです。源流は2004年のホリデーシーズンにAmazonが社内向けに開発したDynamoで、そのときの教訓を綴った2007年のSOSP論文は分散DB研究の必読書になっています。L... -
データベース・データ管理
Cassandra — Facebook発、無停止運用を支える分散NoSQL
Apache Cassandraは、2008年にFacebookがInbox検索のために内製し、その後Apacheへ寄贈した分散型NoSQLデータベースです。Amazon Dynamoの分散モデルとGoogle Bigtableのデータモデルを掛け合わせた設計が特徴で、ノードを足すほど書き込み性能が線形に伸... -
AI・機械学習・データサイエンス
MLOps — 機械学習を本番運用へ橋渡しするDevOpsの拡張領域
MLOps(Machine Learning Operations)は、機械学習モデルを本番システムへ継続的にデプロイ・運用・改善するためのプラクティスと、それを支える技術スタックの総称です。ソフトウェア開発で確立されたDevOpsの思想を機械学習に拡張する概念で、2015年にG... -
AI・機械学習・データサイエンス
DVC — Gitワークフローに乗るデータ・モデルバージョン管理ツール
DVC(Data Version Control)はサンフランシスコのスタートアップIterative.ai社が中心となって開発するOSSのデータ・モデルバージョン管理ツールです。創業者のDmitry Petrov氏(元Microsoft、PhDの研究者)が2017年に公開し、「Gitに馴染んだ開発者のワ... -
AI・機械学習・データサイエンス
Ray — Pythonで分散ML・強化学習を書くためのスケーリング基盤
RayはUCバークレーRISELab発の汎用分散計算フレームワークで、2017年にRobert Nishihara氏とPhilipp Moritz氏らが論文「Ray: A Distributed Framework for Emerging AI Applications」と共に公開しました。Pythonの関数やクラスに@ray.remoteを付けるだけ... -
AI・機械学習・データサイエンス
Gradio — 機械学習モデルのデモを最短で配るUIフレームワーク
GradioはスタンフォードでPhDを取得していたAbubakar Abid氏らが2019年に立ち上げたPython製の機械学習デモフレームワークです。「入力→モデル関数→出力」をテキスト・画像・音声・動画など豊富なコンポーネントで包み、わずか数行のコードで対話的なWeb U... -
AI・機械学習・データサイエンス
Streamlit — Pythonスクリプトを一瞬でWebアプリに変える分析者向けフレームワーク
Streamlitはサンフランシスコのスタートアップ Streamlit Inc. が2019年10月に公開したPython製のWebアプリフレームワークです。Google X・Zoox出身のAdrien Treuille氏らが、機械学習エンジニアが自分のモデルをチームに見せる際の手間を解消することを目...
