データベース・データ管理– category –
-
データベース・データ管理
第5正規形(5NF):データベース設計の究極の目標
第5正規形(5NF)は1980年代にC.J. Dateによって提案された、関係モデルにおける最終的な正規化基準です。多対多リレーションを排除することで冗長性と矛盾を最小限に抑えますが、その複雑さから実際のデータベース設計では採用が難しい場合も多い。 【こ... -
データベース・データ管理
第4正規形(Boyce-Codd Normal Form):データベース設計における高度なノルム
第4正規形は、関係データベース理論において重要な役割を果たす正規化の段階です。1974年にC. J. DateとF. Kambayashiが提唱し、Boyce-Coddによって形式的に定式化されました。このノルムは3NF以上の属性集団の完全分解を確保することで重複データの削減を... -
データベース・データ管理
第3正規形(3NF):データベース設計における重要な基準
第3正規形は、関係データベース理論において、冗長性と不必要な依存関係を排除する設計原則です。カーネル・ブラウンらの研究により発展し、現在ではSQLをはじめとする多数のRDBMSで標準的な基準となっています。 【この記事の目次】 第3正規形の定義と役... -
データベース・データ管理
第2正規形:データベース設計における重要なステップ
第2正規形(2NF)は、関係データモデルにおいて、1NFに達した後に行われる二段目の正規化処理であり、重複をさらに排除する役割を果たす。この記事では、2NFの定義から歴史的背景までを詳述し、現代的なデータ管理における位置づけや実装方法についても考... -
データベース・データ管理
第1正規形(1NF):データベース設計の基礎
第1正規形は1970年代後半にE.F. コッドが提唱した概念で、関係モデルにおける最低限のデータ整合性を定義する。現在ではすべてのデータベース設計において基本的な要件とされている。 【この記事の目次】 第1正規形の定義 第1正規形の歴史的背景 第1正規形... -
データベース・データ管理
Apache Arrowとは|メモリ列形式の業界標準を徹底解説
Apache Arrow(アロー)は2016年にWes McKinneyらが立ち上げた、言語横断のインメモリ列指向データ形式である。pandasやParquetなど既存ライブラリが各々独自のメモリレイアウトを持っていたためにデータを交換するたびにシリアライズ/デシリアライズが必... -
データベース・データ管理
Apache ORCとは|Hive生まれの高密度列指向フォーマット
Apache ORC(Optimized Row Columnar)は2013年にHortonworksがHive用に開発した列指向ファイル形式で、当時主流だったRCFileとTrevniを置き換えるべく設計された。Parquetと並ぶHadoop系の二大列指向フォーマットとして知られ、Hive・Presto・Trino・Spar... -
データベース・データ管理
Apache Avroとは|スキーマ進化に強い行指向データ形式
Apache Avro(アヴロ)は2009年にHadoopの主要メンテナDoug Cuttingが発案した行指向のデータシリアライズフォーマットで、Apache Software Foundationのトップレベルプロジェクトとして発展してきた。Protocol BuffersやThriftと並ぶバイナリ表現でありな... -
データベース・データ管理
Apache Parquetとは|列指向ファイル形式の決定版を解説
Apache Parquet(パーケ)は2013年にTwitterとClouderaが共同で公開したオープンソースの列指向ファイル形式で、Hadoopエコシステムから生まれながら現在ではSpark・Presto・Trino・DuckDB・BigQuery外部テーブルなど多くの分析エンジンが第一級でサポート... -
データベース・データ管理
Redis Searchとは何かインメモリDBで実現するベクトル検索
Redis Searchは、インメモリデータストアのRedisに全文検索とベクトル検索の機能を追加するモジュールで、Redis Stackや旧RediSearchとして提供されてきました。Redisが本来得意とする低レイテンシなキーバリュー操作と組み合わせ、ベクトル類似度検索とBM...
