■ データ・プレパレーションはセルフサービスBIの発展形

●セルフサービス BIの再確認

セルフサービスBIは以前にも解説したが、改めてポイントだけ説明する。「BIとは会社内に散在する顧客情報、営業情報、取引情報、経理情報、経営情報などを統合し特定のスタッフに頼ることなく自分が欲しい分析情報をセルスサービスで取得できるツール」の事だ。EXCELと比較される事が多いが、EXCELを利用する場合にはマクロや関数、ピボットなどの理解が必要で、どうしてもITスキルが高いスタッフに頼らないと出来ない場合が多い。BIなら、こうした分析解析のスキルが無くても簡単なマウス操作でほしい情報が手に入る。

●データ・プレパレーションとは

しかし企業内のデータはデータフォーマットの多様化やデータ量の増加などもありセルスサービスBIでも、操作テクニックと処理時間が係ることが、さらなる課題となっている。

しかし、この データ・プレパレーションにより、 活用の自由度がさらに高まり、処理速度も解消できるようだ。おそらくはデータ処理の事前加工や機械学習などの機能で課題を解決しているのだろう。

このデータ・プレパレーションの代表的ツールが「Paxata(パクサタ)」と言える。

● 「Paxata(パクサタ)」の特徴

  • セルスサービスBI の進化系ツール。
  • 情報取得がより簡単になった。
  • 処理速度が飛躍的に向上した事で、大量データもスピーディにアウトプットされる。

■「Paxata(パクサタ)」 のできる事

Paxataは、現場のユーザーがほしいデータを自分で準備できる環境を提供。利用者は視覚化されたデータを見ながら、マウスのクリックだけの操作で、簡単にノンコー ディングでデータを作成できる。すべてサーバで管理するため、セキュリティとガバナンスのも守られる。

■主な機能

●データ追加
データベースやHadoop、Amazon S3、Amazon Redshift、Salesforceなど、ビジネスで利用されている様々なシステム、ローカルファイル(Excel、CSV、JSON、XML、Avro、Parquetなど)を取り込みが可能。

●探索
データを視覚的にプロファイリング。データの傾向を即座に把握できる。
データ検索や、異常値・重複値の検知や削除など、高精度なデータを作成。

●整備と変更
SQLやマクロなどをコーディングすることなく、選択肢をクリックするだけのシンプルな操作。処理の結果はリアルタイムに画面に表示される。

●整形
クロス集計表を通常のテーブル形式へ変換したり、テーブルの縦横変換、ピボットテーブルの作成、明細データの集計など、様々な整形処理を画面上の操作可能。

●統合
データを取り込むと結合キーの候補が自動的に表示されるため、ExcelのVLOOKUPやSQLのJOINを用いることなく、クリックの操作だけでデータを結合できる。

●強化
アルゴリズムを指定するだけで自動的に値のグルーピングを実施。データに含まれる表記の揺れを効率的に解消し、良質なデータを生成。

●発行
アンサーセットをCSVやExcel、JSON、XMLなどのファイル形式でエクスポート、データベースやHadoopなどのエンタープライズシステムへもエクスポート可能。

●共有とガバナンス
すべてPaxataのサーバ上で一元管理されるため、セキュアな環境でリソースを共有できる。実行した作業はログに記録されるため、だれが、いつ、どのデータに対して、どのような加工を実施したのかを把握できる。

■「Paxata(パクサタ)」 の詳細はこちら