データベース・データ管理– category –
-
データベース・データ管理
LanceDBとはRust製の組込み型ベクトルデータベース
LanceDBはLance Labs(旧Eto Labs)が2023年から公開しているオープンソースのベクトルデータベースで、Rust言語で書かれた本体と、Pythonおよび TypeScriptクライアント、独自の列指向ファイルフォーマットLanceを組み合わせた構成を取ります。SQLiteのよ... -
データベース・データ管理
Faissとは何かMeta製ベクトル類似度検索の定番ライブラリ
FaissはMeta(旧Facebook)のAIリサーチ部門であるFAIRが2017年に公開した、C++とPythonバインディングで構成されるベクトル類似度検索ライブラリです。データベースではなくライブラリとして提供される点が独特で、アプリケーション内部に組み込んで使う... -
データベース・データ管理
Milvusとは何かCNCFが育てる大規模ベクトルDB
MilvusはZilliz社が2019年に公開し、現在はCNCF(Cloud Native Computing Foundation)のインキュベーションプロジェクトとなっているオープンソースのベクトルデータベースです。コンピュート、ストレージ、メタデータを分離したクラウドネイティブ志向の... -
データベース・データ管理
Chromaとは何かPythonネイティブなベクトルDBの素性
ChromaはChroma社が2022年から公開しているオープンソースのベクトルデータベースで、Pythonライブラリとしてpip install chromadbだけで使い始められる軽量さが大きな特徴です。LangChainやLlamaIndexの初期チュートリアルで採用されたことから普及し、RA... -
データベース・データ管理
Qdrantとは何かRust製ベクトルDBの設計を読み解く
Qdrantはベルリン発のスタートアップが2021年から開発しているオープンソースのベクトル検索エンジンで、Rust言語で書かれた本体と、PythonやTypeScript、Go向けの公式クライアントから構成されます。HNSWインデックスとペイロード(メタデータ)に対する... -
データベース・データ管理
WeaviateとはGraphQLで扱えるベクトル検索エンジン
Weaviateはオランダ拠点のSeMI Technologiesが2019年に公開したオープンソースのベクトルデータベースで、Go言語で書かれた本体に対してGraphQLとREST、gRPCの三系統のAPIを備え、テキストや画像、音声などの埋め込みベクトルを近似最近傍探索で照合します... -
データベース・データ管理
Whoosh — 純Python実装のシンプルな組込型全文検索
WhooshはMatt Chaput氏が2007年頃から開発を始めた純Python実装の全文検索ライブラリで、外部依存なしにpipで導入できる手軽さから個人プロジェクトや軽量ツールで広く使われてきました。Apache Luceneにインスパイアされた設計を持ちながら、Pythonの標準... -
データベース・データ管理
Apache Lucene — 全文検索エンジンの世界標準ライブラリ
Apache LuceneはDoug Cutting氏が1999年に開発を始めた、Java製のオープンソース全文検索ライブラリです。検索エンジンそのものではなく「検索エンジンを作るためのライブラリ」であり、Apache Solr、Elasticsearch、OpenSearch、Nutch、CrateDBなど現代の... -
データベース・データ管理
Apache Solr — Lucene基盤の老舗エンタープライズ検索
Apache Solrは2004年にCNETのYonik Seeleyによって開発が始まった、Apache Lucene上に構築された分散検索プラットフォームです。2006年にApache Software Foundationへ寄贈され、2010年にはLuceneとSolrが同一プロジェクトに統合されました(その後2021年... -
データベース・データ管理
Manticore Search — Sphinxを発展させた現代版OSS検索
Manticore Searchは2017年にSphinx Search 2.3.2系からフォークしたC++製のオープンソース検索エンジンで、Sphinxコアコントリビュータが中心となって設立した英国法人Manticore Software Ltd.が開発を続けています。Sphinxのプロプライエタリ化への懸念か...
