データベース・データ管理– category –
-
データベース・データ管理
ArangoDB: グラフデータベースとドキュメントデータベースの統合
ArangoDBは2012年に設立され、グラフデータベースとドキュメントデータベースを一体化した革新的なソリューションとして知られる。この記事では、その特徴的な機能やアーキテクチャ、および業界での地位に焦点を当てる。 【この記事の目次】 ArangoDBの主... -
データベース・データ管理
Apache TinkerPop: グラフデータベース操作フレームワーク
Apache TinkerPopは、2013年から開発が進められているオープンソースプロジェクトで、グラフデータベースやグラフ計算エンジンに対する一貫性のあるインターフェースを提供する。このフレームワークにより、デベロッパは異なる実装間での操作をスムーズに... -
データベース・データ管理
Apache Storm: データ処理フレームワーク
Apache Stormはリアルタイムデータ処理ツールとして知られ、Twitterが2011年に開発しオープンソース化した。ストリーミングデータを効率的に分散処理する能力で評価されている。 【この記事の目次】 Apache Stormの定義 Apache Stormの歴史的背景 Apache S... -
データベース・データ管理
Apache Spark Streaming: リアルタイムデータ処理フレームワーク
Apache Spark Streamingは、Apache Sparkフレームワークに基づき開発されたリアルタイムデータ処理ツールです。2014年に公式リリースされ、ビッグデータ解析において重要な役割を果たしています。 【この記事の目次】 Apache Spark Streamingの概要 Spark ... -
データベース・データ管理
Apache Spark: 大規模データ処理フレームワーク
2010年にアパッチソフトウェア財団から誕生したApache Sparkは、Hadoopと並ぶ大規模分散処理技術として急速に普及。メモリ内計算機能により高速性能を実現し、データ分析の新しい時代を開いた。 【この記事の目次】 Sparkの基本概念 Sparkストリーミングと... -
データベース・データ管理
Apache Solr:検索エンジン用オープンソースソフトウェア
Apache Solrは、高度な検索機能を備えたリポジトリとして開発され、2004年頃にLuceneから分離。現在では全文検索やフリーテキスト検索を実現する代表的なシステムとなっています。 【この記事の目次】 Apache Solrの基本概念 Apache Solrの開発・進化 Apac... -
データベース・データ管理
Apache Samza: 分散ストリーム処理フレームワーク
Apache Samzaは、分散メッセージングシステムと関連するコンテナによるストリーム処理を担うフレームワークとして2014年にApacheソフトウェア財団に登録されました。Twitterの内部で開発され、その後オープンソース化されたSamzaは、高度なリアルタイムデ... -
データベース・データ管理
Apache Pinot: 高速リアルタイムデータ分析プラットフォーム
Apache Pinotは、リアルタイムでの大量データ処理を得意とするオープンソース・データ管理システムです。2013年にマイクロソフトが開発し始め、2018年にApacheのプロジェクトとなったPinotは、分散型アーキテクチャと効率的なストレージによって高性能な分... -
データベース・データ管理
Apache Parquet:効率的なデータ配列形式
Apache Parquetは、Apache Hadoopエコシステムで広く利用されている二進形式の列指向ファイルフォーマット。2013年に初めてリリースされ、その高い圧縮率とパフォーマンスにより一気に人気を博した。 【この記事の目次】 Apache Parquetとは Parquetの歴史... -
データベース・データ管理
Apache ORC: 高効率なデータストアフォーマット
Apache ORCは、Apache Hadoopエコシステムにおいて高速なデータアクセスを実現するための柱となるデータフォーマットです。2013年にデビューし、その後も継続的な改良が行われています。本記事ではORCの基本概念から進化した特性まで、その全貌に迫ります...
