注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

yu.chen的博客

坚持到底就是胜利

 
 
 

日志

 
 
关于我

喜欢数学, 喜欢编程,喜欢开发系统,喜欢逆向工程,喜欢欣赏开源前辈的代码

网易考拉推荐

机器学习  

2013-06-16 21:15:21|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
周日停了一会erlang程序开发,看了几个小时的机器学习。书名是machine learning for hacker。
第一章就是关于R语言的基础支持。
它是通过示例开始教学R语言的,也就是通过源代码,是我习惯的方法。学了几个小时后,感觉探索性的方法比较适合我。

下面是学到的内容:
1. R语言不适合大数据的处理。性能差一些,google与facebook用它作为沙盒,后期改成C的代码
2. CRAN, R repository for packages
3. http://www.infochimps.com, 是一家提供数据上传下载,数据交易的网站。
4. 大数据的资料
http://wot.51cto.com/bigdata2013/ppt_download.html
5. github中有相关的源码,
https://github.com/pingles/machine-learning-for-hackers/blob/master/src/chap1/ch1.r
6. 比较各种统计工具
http://www.ctocio.com/hotnews/6700.html
7. 介绍了graph的内容
With ggplot2 we must always work with data frames, and the first argument to create a ggplot object must always be a data frame. ggplot2 is an R implementation of Leland Wilkinson’s Grammar of Graphics [Wil05]. This means the package adheres to this particular philosophy for data visualization, and all visualiza- tions will be built up as a series of layers. For this histogram, shown in Figure 1-5, the initial layer is the x-axis data, namely the UFO sighting dates. Next, we add a histogram layer with the geom_histogram function. In this case, we will use the default settings for this function, but as we will see later, this default often is not a good choice. Finally, because this data spans such a long time period, we will rescale the x-axis labels to occur every 50 years with the scale_x_date function.
  评论这张
 
阅读(143)| 评论(0)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2018