PythonとpandasでCSVファイルを読み込もうとしたら、いつもはうまくいくpd.read_csv()が突然エラーを吐き出して、処理が止まってしまった…。そんな経験はありませんか?特に、様々なシステムから出力された生データを扱う際によく遭遇するのがこの問題です。
はじめに ― なぜ「前処理」がすべての起点なのか 「AIで業務を自動化したい」「社内Botを作りたい」——そんな意気込みでPythonを学び始めたものの、最初にぶつかる壁は意外なところにあります。 **データが汚い。** 日付の形式がバラバラ、数値に全角 ...
まずは、前回のおさらいだ。前回に取り上げたコードよりもシンプルにしたコードを次に示す。 pandas_create_4.py import pandas as ...
会員(無料)になると、いいね!でマイページに保存できます。 上記以外に、機械学習を実装するときに使うPythonのオープンソースのライブラリもあります。代表的なものがscikit-learnです。 scikit-learnは開発が活発に行われているため、改善が高速に進み ...
最初に「DataFrame」を理解しよう pandasを使う上で最初に押さえておきたい知識が「DataFrame」です。各種分析などのデータ操作を行うためのオブジェクト(DataFrameオブジェクト)です。 図1 のような構造で表形式のデータを保持します。加えて、各種属性やメソッドも備えています。
門脇@satoru_kadowakiです。今月のPython Monthly Topicsでは、Rust製の高速データフレームライブラリ Polarsについて紹介します。 Polarsとは Pythonでデータ分析に使用される主なライブラリに pandasがあります。Polarsはpandasと同様にデータフレームというデータ構造 ...
最初に、PythonとExcelで「どちらが気軽に使えるか」を比べてみよう。言うまでもなく、Excelを使う時は、スプレッドシートのセルにデータを入力し、マウスで操作を選んでいくというスタイルだ。これに対して、Pythonはエディタでプログラムを書いて実行する ...
今や大人気のスクリプト言語「Python」は、PC内の処理はもちろんインターネットやクラウドとの親和性も高いという特徴を持つ。Pythonを使ってExcelファイルの変換などPC内で完結する処理から、クラウドを活用した各種自動化処理まで便利なスクリプトの数々を紹介する。
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する