选股:妖股是如何割韭菜的

image

看抖音选股票

最近刷抖音看了一位播主比较生动地介绍了庄家是如何通过各种方式割韭菜。

播主在视频里面所说的确实是炒股割韭菜的一些老套路。除了股东名册我们普通大众是拿不到之外,持股集中度、市值大小、年线等这些指标还是可以通过公开信息获得。

因此,我尝试着按照 持股集中度市值大小 这两个指标来筛选股票。

妖股的选取指标

  • “市值不会特别大,一般20亿至30亿”
    • 股权集中度高,容易操盘
  • 散户不能太多
    • 查看持股人数

关于持股集中度的的判断,最开始是打算通过最新一期的数值和历史平均值作比较来得出答案,但怕历史极端的数值会影响平均值的水平。

如果使用均值和标准差的话,又不能判断最新一期的数据的高低。

最后决定使用自回归综合移动平均线 (ARIMA)ARIMA 是一种统计分析模型,它使用历史时间序列数据(这里的股东持股人数也有这个特征)来预测未来的趋势。如果最新一期的数据与预测值的数据相差很大,那么我们可以赋值其结果为True,否则为False

In time series analysis used in statistics and econometrics, autoregressive integrated moving average (ARIMA) and seasonal ARIMA (SARIMA) models are generalizations of the autoregressive moving average (ARMA) model to non-stationary series and periodic variation, respectively. All these models are fitted to time series in order to better understand it and predict future values. The purpose of these generalizations is to fit the data as well as possible. Specifically, ARMA assumes that the series is stationary, that is, its expected value is constant in time. If instead the series has a trend (but a constant variance/autocovariance), the trend is removed by “differencing”,[1] leaving a stationary series. This operation generalizes ARMA and corresponds to the “integrated” part of ARIMA. Analogously, periodic variation is removed by “seasonal differencing”. – Autoregressive integrated moving average - Wikipedia

计算思路

这里简单说一说计算思路。

  1. 通过tushare接口获取获取所有上市公司(合计5354只,含北交所)股东户数数据、市值、pe等数据
  2. 利用ARIMA计算每只个股最新一期公开的股东数是否低于前期值:from statsmodels.tsa.arima.model import ARIMA
  3. 如果股东数低于前期值, 合并对应最新市值(截至2024-11-27
  4. 筛选市值低于100亿的股票(合计2051只

image

虽然最终得到了一份数据表,但显然这结果是不够精细的。 从5000多只股票中筛选下来还剩2000多只, 如果只看这这数据显然是无法使用的。 后期我们还是需要通过结合其他指标来进一步筛选,否则意义不大。

奇思妙想

之前写过一篇关于上证指数从2600反弹到3400的过程中涨幅最厉害的个股统计,其实可以通过结合这数据来看看当时候涨幅最猛的股票是否符合股东持股集中度高、估值小的特征。

附件: