缘起

不知道从什么时候开始,广大程序猿们(不包括程序媛们)总是被调侃,一直都是那个靠实力单身的群体。
而根据网上不知道是否准确的数字,中国的单身人口高达2亿,我的天,不能这两亿都是程序猿吧

看过这篇数据分析,再也不要说你是凭实力单身了_第1张图片
今天不是来探究这个单身数字的,而是选择了一个切入点,来探究下,码农单身到底是哪里的锅。

切入点

而我选择的切入点就是人口结构数据,通过观察人口结构,男女比例,来看看单不单身,是不是由你说了算。

首先感谢下“快易理财网”的数据

https://www.kuaiyilicai.com/

我这里使用的数据,都是来自于该网站,网站上还有各类财经数据,有兴趣的小伙伴儿们可以去看看。

获取我国女性占比

首先我们先来抓取下我国女性的逐年占比数据,看看找对象在什么时代能容易些

看过这篇数据分析,再也不要说你是凭实力单身了_第2张图片
抓取该网站还是很容易的,直接解析 HTML 文件即可

import requests
from bs4 import BeautifulSoup

url = 'https://www.kuaiyilicai.com/stats/global/yearly_per_country/g_population_female_perc/chn.html'
res = requests.get(url).text
html = BeautifulSoup(res, 'html.parser')
html.find('tbody').find_all('td')

这样,就获取到了所有的表格数据

[2018年,
 48.68%,
 2017年,
 48.67%,
 2016年,
 48.65%,
 2015年,
 48.64%,
 2014年,
 48.63%,
...

不过这个表格数据里会有一些广告代码,需要去掉下

chinese_data = html.find('tbody').find_all('td')
i = 0
for d in chinese_data:
    if r"adsbygoogle" in d.text:
        chinese_data.pop(i)
    i += 1

接下来就可以获取年份和对应的数据了

year = []
data = []
i = 1
for d in chinese_data:
    if i == 1 or i%2  != 0:
        year.append(d.text)
    else:
        temp = d.text.split('%')
        data.append(temp[0])
    i += 1

拿到 year 和 data 两个列表后,我们就可以开始作图了。

当然我还获取了世界上其他国家的女性比例,出生比例等数据,抓取方式都类似,就不再一一重复了。

作图分析

历年女性占比分析

看过这篇数据分析,再也不要说你是凭实力单身了_第3张图片

可以看到,我国的女性占比常年是低于50%,大胆推测,这绝对和我们上下五千年的历史文化遗留有关啊,嗯,就说到这,不能再多说了。

然后还能看出,在新中国建国初期,女性的比例是最低的,之后才逐年增加。

不过情形在慢慢变好,在上世纪80年代左右,我国的女性占比很好的稳定在了48.69%-48.68%这里,而48.69%竟然已经是女性占比的最高比例了。

接着又不太清楚是什么情况,在新千年的前十年里,女性比例又大幅下降,随后才又逐年增长,不知道正在上小学或者初中的小男孩们,有没有感觉到身边的异性有点少啊。

我这里还做了柱状图,同样可以看到在60年到70年这十年里,女性比例的增长还是非常明显的

看过这篇数据分析,再也不要说你是凭实力单身了_第4张图片
接下来我们着重看看2018年的数据吧,这一年女性占比为48.68%,而根据人口普查,2018年我国总人口为13.93亿 (1,392,730,000),那么男性比女性就多出了36,768,072,整整3千6百多万人啊,所以说如果你在去年还是单身的,那么不要悲伤,因为最少还有3千多万人陪着你,当然如果你现在成功脱单了,祝贺你,你是那个踏过独木桥的人,请一定要珍惜

历年出生比例分析

出生人口性别比是指活产男婴数与活产女婴数的比值. 正常情况下,出生性别比是由生物学规律决定的,保持在1.02—1.07之间。
也就是说正常情况下统计学界和生物学界已经默认了男性出生比例要高于女性呀,苦不苦,看看人家萨达姆吧。

看过这篇数据分析,再也不要说你是凭实力单身了_第5张图片

下面就来看看我国历年的出生性别走势图

看过这篇数据分析,再也不要说你是凭实力单身了_第6张图片
可以看到,在1990年以前,我们出生性别比例还都能保持在正常情况下,但是在临近新千年和新千年的头十年里,这一比例大幅增长,难道说在这一期间“养儿防老”这一口号正在盛行?

具体原因就不再深究了,咱也不知道,咱也不敢说啊。

我们还是找一年为例子,看看该年出生的男女数量的差值

我们以2007年为例子,他的出生性别比例为1.17,我们拿不到当年的总的出生人数,但是可以拿到当前的出生率和人口总数啊,那么也是可以勉强计算下的。

在我的一番小学数学操作下,得出2007年出生男孩比女孩多了1,672,560人,一百多万啊,这还只是一年,那么多年累计下来,差个3千多万也就正常了。

看过这篇数据分析,再也不要说你是凭实力单身了_第7张图片
所以说,在2007年出生的男同胞们,虽然还!没!到!找!对!象!的时候,但是要趁早啊,你们压力山大,形势险峻啊!大学时能下手,不要等到毕业;高中时有机会,不要留到异地;初中时有想法,别想着上高中的;小学时春心动了,你就等着挨揍吧(男女混合双打,就问你怕不怕)!

看过这篇数据分析,再也不要说你是凭实力单身了_第8张图片

上面说了这么多国内的苦大仇深,接下来看看世界范围内的数据吧,是幸福还是痛苦,比对才能出真理啊

世界各国女性占比

我这里先选取了世界范围内女性占比前十的数据,来看看哪个国家的男同胞们最幸福

看过这篇数据分析,再也不要说你是凭实力单身了_第9张图片
我们一直听到的都是东欧美女多,剩女也多,看来真的不假啊,拉脱维亚、立陶宛、乌克兰,白俄罗斯这些国家是不是大家都耳熟能详,在多少个慢慢长夜,孤枕难眠的时候,哎呀我去,跑题了!

不过前些年网络上流程的国内屌丝小伙,到了乌克兰通过个人奋斗,成功迎娶白富美,走上人生巅峰的事迹还是一直在激励着我(们)呀。

看过这篇数据分析,再也不要说你是凭实力单身了_第10张图片
这么多年过去了,他还好吗?

再来看下榜单的第一位,库拉索,这是个神马地方,表示没听过。百度之

看过这篇数据分析,再也不要说你是凭实力单身了_第11张图片
原来是荷兰王国的自治领地啊,人口常年在15万人左右,没啥好说的
看过这篇数据分析,再也不要说你是凭实力单身了_第12张图片

下面就刺激了,我们来看看女性比例排名后十的国家和地区都是哪些呢

看过这篇数据分析,再也不要说你是凭实力单身了_第13张图片
从后面数五个国家,清一色的中东国家,看起来就再正常不过了。而卡塔尔和阿联酋的女性比例竟然还不到30%,这也太低了,怪不得有同事从中东回来说,看见母猪都是亲切的。
看过这篇数据分析,再也不要说你是凭实力单身了_第14张图片

世界范围出生性别比例

最后我们再来看下在世界范围内,出生性别比例的数据

比例最高的前十名

看过这篇数据分析,再也不要说你是凭实力单身了_第15张图片
没想到我国竟然荣登榜首,看来两千多年的封建史,带来的某些根深蒂固的思维,不是一时之间就可以完全冲破的。时至今日,还有相当一部分的人保留着陈旧的思想--重男而轻女。但是啊,时代不同了,男女都一样喽

看过这篇数据分析,再也不要说你是凭实力单身了_第16张图片

所以说,综上分析,作为程序猿们,我们成功脱单,那是个人实力和人格魅力的成功体现,如果还在单身,没事儿的朋友,大环境不好啊

看过这篇数据分析,再也不要说你是凭实力单身了_第17张图片

好了,今天的分享就到这里了,怎么样,找到你单身的原因了嘛,你赶上那个最好最坏的时代了吗?