IT用語集– tag –
-
未分類
HuggingFace datasets: 大規模な学習データ集
2018年に設立されたオープンソースのプラットフォーム、Hugging Faceが提供するdatasetsは、自然言語処理モデルを訓練するための大規模なデータセットをホストしています。ここでは、その仕組みと特長について詳しく解説します。 【この記事の目次】 Huggi... -
未分類
Dataset.select(): データ抽出メソッド
Pythonのデータ処理や機械学習フレームワークにおいて、Dataset.select()は重要な役割を果たします。この関数を使用することで、特定の条件に該当するレコードを効率的にフィルタリングできます。 【この記事の目次】 Dataset.select(): 概要と目的 Datase... -
未分類
Dataset.map(): データ処理を簡潔に表すメソッド
PythonのデータサイエンスライブラリであるPyTorchやTensorFlowでは、データセットの操作を効率的に実装するための重要な関数としてDataset.map()が利用されています。この記事では、この関数の起源から最新の応用までを詳しく解説します。 【この記事の目... -
未分類
Dataset.filter(): データセットから条件にマッチするレコードを抽出
Dataset.filter()は、機械学習プロジェクトにおいて重要な役割を果たすメソッドです。PythonのPandasライブラリにおけるfilter関数は、データ解析の初期段階で大量のデータから特定のレコードだけを選別するために使用されます。 【この記事の目次】 Datas... -
ビジネスIT・DX・SaaS
DataRobot: AIプラットフォームの先駆者
2012年に設立されたDataRobotは、機械学習とAIを容易に利用可能にするためのSaaS型ソフトウェアを開発。金融、製造業など多様な業界で活用され、近年では自動化によるモデル開発における革新性が評価されている。 【この記事の目次】 DataRobotとは DataRo... -
ネットワーク・インフラ・クラウド
Google Dataproc Serverless: クラウド上でのビッグデータ処理
2019年にGoogle Cloudによって導入されたDataproc Serverlessは、サーバーレスのアプローチを採用し、ビッグデータ処理における管理負担を大幅に軽減しました。この記事では、その仕組みや機能について詳しく解説します。 【この記事の目次】 Dataproc Ser... -
ネットワーク・インフラ・クラウド
Dataproc: Google Cloud Platform上のビッグデータ処理
2017年に登場したGoogle Cloud Dataprocは、HadoopとSparkを簡素化し高度な分析作業を可能にします。本記事ではその概要、機能強化の経緯、および他のクラウドサービスとの比較を取り上げます。 【この記事の目次】 Dataprocとは何か Dataprocの進化 Datap... -
ネットワーク・インフラ・クラウド
Dataprep詳細: データ準備と前処理ツール
Dataprepは、データウェアハウスや分析環境に必要な大量のデータを効率的に準備するための自動化ツールです。2014年に発表されて以来、Google Cloud Platformにおいて重要な役割を果たし続けています。 【この記事の目次】 Dataprepとは Dataprepの進化と... -
ネットワーク・インフラ・クラウド
Google Dataplex: データ管理と分析の一元化プラットフォーム
2021年に登場したGoogle CloudのDataplexは、デジタル化が進む企業にとって不可欠なツールとなりつつある。この記事では、その概要から機能、そして競合製品との比較までを深堀りする。 【この記事の目次】 Dataplexとは: データ管理とガバナンス Dataplex... -
ネットワーク・インフラ・クラウド
Dataplex詳細:Google Cloud上のデータ管理と分析
Dataplexは、Google Cloudが提供するデータライフサイクルマネージャーであり、企業の大規模なデータセットを効率的に整理・保護し、分析に利用可能にするテクノロジーです。2019年に初登場したこのサービスは、データ統合や可視化の難しさに対処するため...
