あなたの分析ソリューション

Excelへの大規模CSV またはテキスト・ファイルの読み込み

27/11/2018

このチュートリアルは、XLSTATのデータ・マネジメント機能を用いてExcelにテキストまたはCSVデータ・ファイルを読み込んで分析する方法を説明します。

このインポートの方法は、ワークシートにではなくコンピュータのメモリーにデータを読み込みます。したがって、我々は標準のExcelワークシートのサイズ(Excel 2016では 1,048,576 行と 16,384 列)を超えるデータ・ファイルを読み込むことができます。

データセット

セール・マネージャが毎日2つのファイルを記録しています。1つめのファイル (table 1) は、製品ID(Product ID) と請求金額(invoice)で、一方、2つめ(table 2)は各店舗(store)の注文ID(Order ID)を格納しています。


こちらをクリックして Table 1をダウンロード

こちらをクリックしてTable 2をダウンロード

こちらをクリックして出力ファイルをダウンロード

このチュートリアルの目的

セールス・マネージャは、各店舗ごとに合計請求金額をみたいとします。この目的のために、彼はExcel ワークシートにデータを読み込むのではなく、メモリーで直接作業したいです。まず、我々は、各請求額を正しい店舗と照合するために、2つのファイルを結合します。そして、店舗ごとに請求額の合計を計算します。

インポート・データ・ファイル・ダイアログ・ボックスの設定 

ステップ 1: 2つのテーブルのJoin

XLSTATを起動すると、XLSTAT/データ準備/データ・マネジメントコマンドを選択してください。

ダイアログ・ボックスが現れます:

手法フィールドで、結合(内側)を選んでください。2つの新しいフィールドが現れます:表1表2

テキスト・ファイルをデータ・ソースとして使用するには、オレンジ色のペーパー・シートが現れるまでマウス・アイコンをクリックしてください(図4)。各表のフィールドの隣にクエスション・マークが現れます(図4の丸印)。

1番目のファイルを読み込むために、表1の隣のクエスション・マークをクリックしてください。 インポート・データ・ファイルダイアログ・ボックスが現れます(下図)。 demoDMAJoin_Order.txtを読み込むようにパラメータを設定します。これらのパラメータは: a) 各列のセパレータを定義する区切り文字(このデータ・ファイルでは、TABが使用されます)、b)複雑な要素を定義するテキスト修飾子(すなわち、スペース、区切り文字などの要素)、たとえば、 is used),  c) 最初の行をヘッダとして使用するためにスキップすることができるインポート開始行、d) ファイル内のコメント・テキストに必要なコメント修飾子(ここでは、各行で、 文字“#” の後のすべてのテキストは読み込まれない)。

OK ボタンをクリックして、パラメータを保存します。


データ・ファイルを読み込む前にプレビューを見るには、プレビューボタンをクリックしてください:

これで、ダイアログ・ボックス内で変数を選択できます。


表2についても、同じプロセスを繰り返します。



OK をクリックすると、Join (Inner)と名付けられた新しいワークシートに結果が表示されます。

ステップ 2: データを集計(グルーピング)

次のステップは、店舗ごとの合計請求額を計算することです。XLSTAT/データ準備/データ・マネジメント コマンドを再び選択してください。マウス選択モードに切り替えるために。オレンジのペーパー・シートを1回クリックして、グループ手法を選択してください。データ・フィールドをクリックして、Invoice と Store の列を選択してください。最後に、グルーピング・キー Storeを選択してください。

データ集計の結果がGroupと名付けられた新しいワークシートに表示されます。 合計請求額は、store Aで 109 € 、store Bで97 €、store Cで 27 € です。

1c26995d494fb3061dd0ae8571ffc0a4@xlstat.desk-mail.com
https://cdn.desk.com/
false
desk
読み込み中
秒前
1 分前
分前
1 時間前
時間前
1 日前
日前
バージョン情報
false
無効な文字が見つかりました
/customer/portal/articles/autocomplete
9283