数据分析与炒股

评论2字数 2616阅读模式

上篇2022年计划及理财目标中大致说了我炒股的事,其实反反复复这次已经是第三次进入股市了,而此前两次基本上都是听小道消息炒的,所以尽管连续两次小亏,但还是不知道为什么会亏,这或许就是传说中的韭菜。去年第三次入场是受了一个朋友影响,他是典型的价值型投资者,而我这两年在学习经济学的过程中也接触了一些关于价值投资的理论,于是和他聊天后炒股的冲动又被勾起。当然除了自认为现在对金融和股市的认知比以前强之外,随着年龄的增长劳动技能逐渐退步导致的就业竞争力减弱是我再次进入股市的另一个原因。

朋友属于智商很高的那类人,从事的工作需要数据建模和分析,再加上他近似于偏执的探求精神,因此他做价值投资时对数据格要求也格外苛刻。他对所投的股票基本面做了详尽的研究,而我又自认为懂点经济,于是他便把他的研究结果和我讨论,以期能够查遗补漏。结果是我只能从宏观角度泛泛而谈,对于个股的基本面情况知之甚少,在汗颜中我接受了他的观点,认为当前银行股是价值投资的洼地,而民生银行则被严重低估,适合长期持有。

平白无故的占人便宜总觉得心里不安,于是我也想学学数据分析,这样也好用数据印证主观感觉,避免只能空谈。当然学习数据分析对于我一直喜欢的宏观经济研究也很有用,此前数据都是靠EXCEL分析的,但跨表调用数据并不方便,而我一直的想法就是自己能够建个简单的库,用程序爬取数据,然后用公式自动分析。朋友建议我学python,于是买了教科书,也上网看了教程,发现语言本身并不是很难,但要学会需要花费至少半年的时间,感觉学习的回报并不大,于是给自己一个理由放弃了。

其实我是一个比较懒惰的人,对于很多观点和思路都没有用数据去验证,即使需要使用数据或图表时也优先从网上找现成的,而不是自己动手整理。而网上的数据有很大可能是不准确的,原因是整理数据的人对概念理解的不透彻,错把李凉做李京。平时写博文只是为了读书之后的消遣,或者为表达对某知识点的理解,或者为表达对某事件或观点的看法;但都是爱好驱动,没有一分钱收益,因此也难以有恒心每次都做数据整理。

这种懒惰的习惯也被带到了炒股上,虽然知道这关系真金白银,但每次看财务报表也只是大致翻一番,有个认知就行,和朋友聊股票时依然满怀歉意。前两天朋友告诉我他最近比较忙,问我能不能整理下民生银行的小微贷款不良率,最好能整理出贷款逾期时间30日内不良、30-90天不良,以及其他时段的不良分布。我满口答应,因为我这段时间并不是很忙,同时也以为年报上都有这些数据,只整理下很容易。于是朋友将他此前整理的结果发给我,让我做参考。

但当认真阅读年报后我才发现我想多了,此前没有认真看过年报,仔细阅读后才发现年报的数据并不像我想的那么全面,而且每年公布的数据也并不具有很强的连续性,经常会缺失数据。整体看是2019年之后的最全面,2012年到2018年的次之,2011年之前的可能因为监管要求的原因报表干货最少。仅小微贷款来说阅读了十年的财报我还是没有弄清楚民生银行的小微贷款到底包不包含小公司,还是仅包含个人和个体户,在年报中它们自己也描述的不清楚,在不同年份中分别用了“小微贷款”和“小微企业贷款”两种分类名称。分类都可能出现理解分歧,对于分类下的逾期时间数据就更难以查询了,翻遍年报、官网、及巨潮等专业网站始终不可得。

此时才体会到了数据整理的艰难,或许机构有专门的数据来源途径,或许他们可以直接向上市公司索要,但个人仅靠搜集公开数据要做到准确分析难度不是一般的大。尽管数据很难找全,但朋友吩咐了,好坏我总得交个作业,要不对不起他的托付。于是在耗费了两天时间后勉强整理出下面的表格,数据完整度和设想的差距甚远,但也只能如此了。

数据分析与炒股

上图是民生银行近十年贷款的详细数据,点击可以查看大图,对民生银行或对银行股有兴趣的话可以点开查看,省得自己整理了。

数字表格是最准确的表达形式,但并不是最直观的,所以最好把相关的数据整理成图形。我看网上python的广告认为它可以根据条件自动从网上爬取数据,并可以根据条件自动从库里筛选,并根据公式计算并输出成图表,不知道是不是我想的太美好了。但EXCEL确实无法做到跨行同时跨列调取数据输出图表,如果中间要计算一次,然后再输出图表的话更不容易实现了,当然也可能是我对EXCEL用的不熟的原因。所以用EXCEL输出图表时我还得手动调整数据,调整成想要的样子然后再生成图表。如果明年上市公司的年报更新,那我还得手动再整理一次所有的数据,然后才能输出图表,这样效率特别低。似乎学习VBA语言并搭配EXCEL也能实现类似于python的数据分析功能,但学习成本依然是最大的障碍。

数据分析与炒股

这张图是我朋友最想要的,民生银行近十年公司贷款和个人贷款的比例及各自的不良率。

数据分析与炒股

这张图是个人贷款的组成变化,各部分的不良率,以及个人贷款总额的变化,一张数据能反应的信息很多。

数据分析与炒股

这张图是公司贷款的各部分组成变化,当然对应着应该有一张各组成部分的不良率折线图,但因为数据太多了,图片看起来很混乱,所以我就没有放上来。

银行也年报是上市公司中年报最干净的,很难进行数据修饰,尽管如此对年报的数据我还是有很多疑问,因为很多内容年报也说的很简略。通过上述数据我们不能看出民生银行对城投贷款和城投债的持有情况,也不能看出民生银行通过表外业务持有的房地产债数据,而这些可能都是下一个引爆其股价下跌的潜在因素。按朋友的思路,这些他都想弄清楚,这样才能规避绝大多数风险。除了资产结构,负债结构,利润结构及增速外,流动比、速动比、存贷周转天数、拨备覆盖率、拨贷比、减值损失、产权比率、固定资产比、清算价值比、逾期不良比、新增贷款不良率、市盈率、市净率等,以及这些参数和其他行的对比都要弄清楚。

我最前面那张表看起来数据很多,但也仅为他所需数据很微小的一部分,这还只是银行业的情况,如果再考虑其他板块,比如房地产、绿色能源等领域,那么数据分析将是海量的。面对如此大量的数据我是恐惧的,但他却乐此不疲,因此我深知他在炒股这件事上肯定做的比我好很多,而我只能跟在后面捡桃子。

炒股只是他的业余爱好,也只是他数据分析的一小部分,由此可知他数据处理量有多大。通过炒股这件事,我发现数据处理不仅是一门技术,更是一种态度,是主观和客观的区别,是粗放和严谨的区别。这种态度对我们的生活至关重要,它决定了我们很多事情的成败,但我相信绝大多数人和我一样都缺乏认真对待它的耐心,也缺乏学习这种技能的恒心。

本站文章授权后方可转载,请勿侵权! 如喜欢可点击分享按钮分享。

 
匿名

发表评论

匿名网友 填写信息