Pandas中对 时间 这个属性的处理有非常非常多的操作。
而本文对其中一个大家可能比较陌生的方法进行讲解。其他的我会陆续上传。
应用情景是这样的:考虑到有一个数据集,数据集中有用户注册账号的时间(年-月-日),如下图格式。
如果我们希望对用户账号注册时间转为具体的天数,我们可以用如下代码。
import pandas as pd td=data['user_reg_tm'] Time=pd.to_datetime(td) Start=pd.datetime(2016,4,16) day=Start-Time
最后,把天数插入到原来的表中
data['Day']=day
下面简单的说一下一个时间的创建一些细节。
date=pd.Series(['2016411']) pd.to_datetime(date)
这样就创建一个时间为 2016-4-11的时间值。
这里有个细节,就是字符串里的时间格式,年月日之间如果没有分隔,pandas会自动用-号分开,如果要自己手动分隔,例如
date=pd.Series(['2016-4-11'])
这也可以,或者用/号。但是注意,只能用- 或者/来进行分隔,不可使用别的。
有时候我们还需要有时分秒的信息。
date=pd.Series(['2016-4-11 12:12:12'])
最后再说下一个问题,上面我获得的天数后我们怎么单独取出“天数”来呢?
很简单,用.days来访问。
对于 Series类型,用 data.dt.days
对于Timedelta类型,可以直接访问 即 data.days。
例如:
因为data['Day']是Series类型的
data['Day'].dt.days
因为day是Timedelta类型的
day.days
更新:时间处理下篇链接点击打开链接
以上就是Python Pandas数据中对时间的操作。坚持每天提高1%,70天工作水平就可以提升一倍。更多关于Python Pandas数据中对时间的操作请关注haodaima.com其它相关文章!