我们开始,let's go.
记得看到过一张编程语言的对比表格,MATLAB、C++、R、JAVA、Python在量化金融各个子领域的使用情况,可惜原图找不到了,只记得是Python覆盖了全领域。
选择什么语言,原本各有偏好,条条大道通罗马,只是有的路选择居多。

正所谓人生苦短,我选Python。
Python之下,
有NumPy数学库,有Pandas帮助数据分析,有Matplotlib可以画图,有 Tushare获取财经数据,有TA-Lib帮助计算技术指标,还有 sklearn用于机器学习,上面这些,就是选择理由。
工具准备好了,下面找数据吧。
A股有多少股票?
哪些股票可选?
历史交易数据从哪里来?
实时交易数据又从哪里来?
试试Tushare吧,Tushare注册好了,测试可用。
那获取批量数据吧,wait,要积分、其实是要钱,几百到几千不等。
聚合数据平台呢,也要会员。
还没赚钱,先要投入啊,有没有其他办法?
新浪财经、网易财经、腾讯财经、东方财富等等,自己爬取也可以。
Python开发爬虫,倒也趁手。
查网页,看接口,对上号,一番折腾之后,上面问题渐渐有了答案:
A股有多少股票?
截止2024年2月9日,共有5591只股票,如下图:
A股基础数据
哪些股票可选?
Excel设定过滤条件筛选一下啊,或者编程选一选。
历史交易数据从哪里来?
自2007年1月1日至今的日K数据,已完整。
当然,上市时间晚于2007年1月1日的,自上市之日起才有数据。如下图:
日K线数据
实时交易数据又从哪里来?
同样的数据来源。
有了数据基础,下面我们进入第3天
DAY-3. 量化选股
目前已获取到如下数据:
1、A股现有的5591只股票的基本数据。
2、这5591只股票的日K数据,回溯截止到2007年1月1日的日K数据。
当然,上市时间晚于2007年1月1日的,自上市之日起才有数据。如下图:
3、还有5591只股票的财务数据,包括:资产负债表(BALANCE)、利润表(INCOME)、现金流量表(CASHFLOW),回溯截止到2007年12月31日的季度报表。
全部数据,请见下面网盘链接,
链接: https://pan.baidu.com/s/1Ia5zWm5mJAc3FD8y1NmBJg 提取码:
需要数据的,可与作者联系,给个饮料钱即可。