1.r语言比较好用,sas语言比较晦涩。2.行与行之间的r比sas更容易计算。比r更成熟,很多分析不用写函数就可以直接用。在处理大数据方面更有优势。可以根据自己的情况选择。
使用分析
r语言是一种高效的数据处理工具。在理解之前,先简单解释一下管道函数的用法。
如何使用管道功能
有三种常用的管道函数:
%in%:表示包含在
%gt%:表示向右通过。
%$%:表示向右传递列,可以直接按列操作。
施用
1.首先,格式化数据。
数据数据%gt%
()
2.根据以下五个变量总结数据。
数据数据%gt%
()%$%
。[,.(valuesum(value,na.rmtrue)),
由c(
使用分析
r语言是一种高效的数据处理工具。在理解之前,先简单解释一下管道函数的用法。
如何使用管道功能
有三种常用的管道函数:
%in%:表示包含在
%gt%:表示向右通过。
%$%:表示向右传递列,可以直接按列操作。
施用
1.首先,格式化数据。
数据数据%gt%
()
2.根据以下五个变量总结数据。
数据数据%gt%
()%$%
。[,.(valuesum(value,na.rmtrue)),
按c(#34周期#34、#34索引#34、#34区域#34、#34id1#34、#34id2#34)]
3.按某个类别列的变量值过滤。
数据数据%$%
。[索引%in%c(#34uv#34、#34db#34、#34xs#34),]
4.更改“类别”列中的变量名
数据数据%$%
。[索引名#34db#34,索引名:#34db_pv#34]%$%
。[ind:#34gz_uv#34]%$
。[ind:#34xslz_uv#34]
5.取一列中所有值的前6个字母。
数据数据%$%
。[,#34echo3-@。com#34(id1substr(id1,1,6),
id2substr(id2,1,6))]%$%
。[,.(valuesum(value,na.rmtrue)),
按c(#34周期#34、#34索引#34、#34区域#34、#34id1#34、#34id2#34)]
6.筛选列
数据数据%$%
。[,.(周期,id1,id2,面积,索引,值)]
7.筛选等级
中尉军衔。p[id2%in%target,。(id2,月,省id,省,索引名称,值adjper)]
8.更改列名
数据数据%gt%
集合名称(c(#34period#34、#34car_id1#34、#34car_id2#34、#34area#34、#34value#34)、c(#34month#34、#34id1#34、#34id2#34、#34province#34、#34value#34))
9.按列合并表并筛选一些列。
数据数据%gt%
merge(data2,by.x#34province#34,by.y#34province#34,all.xtrue)%$%
。[,.(月份,省份,id,索引名称,id2,值)]
9.1合并后出现重复的列名。
新数据lt-数据%gt%
合并(数据2,
by.xc(#34id1#34、#34id2#34、#34month#34、#34prov_id#34、#34province#34、#34index_name#34),
by.yc(#34id2#34、#34id1#34、#34month#34、#34prov_id#34、#34province#34、#34index_name#34),
后缀c(#34_p#34,#34_n#34))
10.定义新列
new_datalt-new_data[,#34:#34(scor:row_nnumber(-分数),
按c(#34id2#34、#34month#34、#34prov_id#34、#34provinc:null]