宋鹏程:大数据分析相亲市场鄙视链,工资不到8000直接被淘汰?| 演绎inSite

生活文化
宋鹏程:大数据分析相亲市场鄙视链,工资不到8000直接被淘汰?| 演绎inSite
麻省理工科技评论 2019-03-03

2019-03-03

相亲是一场明码标价的爱情买卖?
生活文化
相亲是一场明码标价的爱情买卖?

演绎inSite第一期节目

相亲是一场明码标价的爱情买卖?

宋鹏程,数聚变(北京)科技有限公司联合创始人兼CTO;清华大学互联网产业研究院研究员。

以下为宋鹏程老师演讲文字稿:

(根据演讲现场整理,有所删减,完整版请看视频)

 

大家下午好,我叫宋鹏程。


是北京数聚变科技的CTO,也是一名理工科博士。我们平时的研究方向就是大数据和人工智能方向,但是今天,我不会跟大家讲大数据和人工智能,我会用数据给大家讲一个故事,然后让大家能够更深入地了解:数据能够用来干什么?


相亲是一场明码标价的爱情买卖吗?


今天故事的主题就是相亲。


这个故事的起源是在今年年初的时候,有一个微博特别特别的火,是《凤凰周刊》调查了北京附近很多相亲角从而得出的一个结论,就是说相亲其实有一个价目单,每个人都是一场明码标价的买卖。

 


大家可以看一下这张图,图的右侧是男性的一些条件,左侧是女性的相应条件。


对男性来讲,它提出了需要用房产、收入、学历、户口,这四个指标来进行评判;对女性来讲,它里面有相貌、收入、学历、房产、户口和属相这六个指标。


单凭数据显示,好像对女性的单身来说会更加苛刻一些。接着我们再看一些具体的分类,可以看到它是把所有的人分成了六等,相当于进行了一个估价,然后就不同档的人互相匹配。

 

这个微博当时非常的火,我看到这条微博的时候就在想,如果相亲真是这样的话,那岂不是就是一个非常简单的过程?我们把自己的数据输入进去,系统直接开始计算,然后相亲网站给我直接按照算法算出一个最为匹配的对象,然后我就能相亲成功了。

 

之后呢,我就对这个表里面的这些指标分别进行了一下研究,看看这些指标是否是相亲中最重要的关键话题,然后就得到了和图里一样的结论:第一个指标是房产。大家也知道现在在大城市定居不易,买一个很小的房子在北京也要400—500万,更大的会更贵,所以在相亲的市场里,房产是首先会被议论到的话题。

 


这个数据是在这条微博出来之后,澎湃新闻去做的一个调查:根据上海一千位相亲者的情况及他们各自的要求所得出的数据。


我们可以看到,蓝色是男性的情况,74%的男性相亲者是有房的,26%的相亲者是没有房的。可以看出在相亲市场上,对男性而言,有房还是一个非常硬的指标,起码占到绝大多数;这其中有4%的男性要求女方也同样拥有房产。但大部分男性对于女方是否有房并没有硬性要求,其中没有房的男性没有一人提出对女方有房产要求。

 


我们再来看一下女性这边的情况,就和男性这边就相差较大了。


可以看出,绝大多数的征婚及相亲女性中,差不多60%没有房产,40%拥有房产;在没有房产的60%里面,有15%对于男性拥有房产提出了明确要求。自身拥有房产的40%女性里,有5%要求男性也应具备房产。


从这个数据可以看出,在房产这个话题上,男性基本上是一个必填项,对女性而言则是个加分项。


收入不到8000元,等于失去脱单资格?



房产之后,下一个话题就是收入。


这个数据是世纪佳缘网统计了它们网站上几百万个相亲对象的情况,然后得出来这么一个统计:2017年底,单身人士里月收入小于8000元的占一小半,达到了48%;8000元到12000元的占比为20%;12000到15000达到了22%;15000以上的仅有10%。

 


从这张图可以清晰地看出来,相亲市场上男性收入越高,则竞争力越强。

 

单看这些数据,可能大家没有什么感觉,所以我又调查了一下国家统计局的数据,从中可以看到:北京市2017年社会平均工资是8467元,上海市2017年社会平均工资是7132元。这说明在这两个大城市里,如果你的收入达不到或小于8000元的话,基本上你就在平均线以下,对于相亲者或者还单身的人来说,那么你需要努力了。因为只有达到平均线以上,这样你才有可能脱单的机会。

 

当然这个收入统计并没有把男性和女性区分开,在实际数据以及其他调查中也发现,女性对男性的收入普遍要求会更高一点;反之,男性对女性的收入并没有特别高的要求。女性普遍收入集中在8000元到15000元这个区间以内,相亲市场中,女性收入太高反而是一个减分项。

 

花式催婚,最为致命



第三个话题就是年龄,这个是一个绕不过去的话题。


对于相亲来说,年龄一年一年的增加,约等于家里压力一年一年的增大。那么全国相亲的人群中,这个年龄到底是怎么分布的呢?

 


我们可以看一下这张统计图表,这张图显示男性的年龄集中在1975年到1991年之间;女性则集中在1983年到1992年之间,现在连90后都已经开始相亲了。

 


从这张图可以看出,普遍情况下,男性会比女性大概年长3到5岁左右,这个数据也比较符合在婚恋市场上大家的要求。一般来说,在相亲条件里,男生会要求女生比自己小一些,从2岁到6岁不等;女性则会倾向于寻找年龄大一点的男士。

 


我们看到这个图是一个年龄的分布,现在我们来做一个变换,把女性的这个图把它给减少两岁,相当于把两个年龄段重合,然后翻上来重合到一起,假设不考虑其它因素,那么只要两个人年龄是对上的,他们就能相亲成功。

 

根据这张图我们能得出什么结论呢?紫色的点代表的是配对成功的恋人;蓝色的点代表的是男性剩余者,其年龄段集中在1975年到1983年;粉色的点代表女性剩余者,主要集中在1980年到1988年。

 

从这两个数据我们可以看出,对女性而言,30岁以后女性的相亲竞争性就会开始下降,很容易成为“剩女”;


而男性要到快40岁左右时,“剩男”几率就会增大,所以如果大家正处在这个年龄段,就一定要加油了。

 

中国式相亲:北京户口=谈判筹码


 

第四个指标就是户口。


在北京的这个调查中,90%的相亲条件都对户口做了要求。在上海的统计里,户口要求则相对较少。

 


从这个图可以看出,蓝色代表男性情况,粉色代表女性情况,实心圆代表的是男性有户口且他要求女方也要有户口、空心蓝色圆代表的是男方没有户口但他要求女方有户口。我们可以看出在婚恋市场上,男方对于女方的要求,户口并不是一个必须的项,女方有也可以,没有也可以;但对于女方来讲,只有20%已有户口的女性不会要求男方有户口,但80%没有户口的女性就会要求男方有户口。

 

从这里可以看出,女性对于户口的要求还是一个比较硬性的指标。因为大家也知道,现在北京、上海这些大城市,户口直接代表了以后孩子的上学、医疗等各种各样的背后属性,所以这也是一个非常重要的指标。



然后这两个对北京和上海的调查也显示出:对上海人来讲,他们的户口并没有北京那么重要。我们通过对比北京、上海、深圳这三个城市的数据,不难看出,北京市2017年户籍人口是下降的,说明北京市2017年新拿到户口的人和离开的人相比起来已经减少了3.7万人,因此也更加说明了北京户口的难拿程度,北京市户口的作用,在相亲的时会显得尤为重要。

 

我们知道上海市是用积分的方式来拿到户口,所以相比北京会稍微好拿一点,因此上海市户籍人口是持增加状态的。

 


深圳市2017年户籍人数增加了50万,这是一个比较大的数目。相当于如果你去深圳,在有一份较好工作的前提下,基本上都是能够拿到深圳户口的,所以深圳的朋友们对于户口的要求相对就没有那么强烈。从这部分数据我们可以明显感受到,在越大的城市,户口在你婚恋谈判中的筹码就更加重要。


女博士为何很难找到另一半?


 

第四个话题就是学历的搭配。一般大家在征婚简历里都会写上自己的学历水平,40%左右的征婚者都会要求对方的学历不低于一个值。


 

蓝色栏是所有男性被调查者中他们自身的学历情况,可以看出,以本科和硕士居多,博士也有一部分,其他较少;粉色这边则是女性自己学历的情况,也是以本科硕士居多,博士就特别特别的少,比男性的博士要少很多。

 

其实根据教育部的统计来看,在校博士生中男性和女性比例是差不多的,这说明一个问题:女博士在征婚时,她不会写自己的学历是博士,她会写硕士以上或压根不写。

 

然后我们再看看他们对另一半学历的要求。


第二列的蓝色条就是女方对男方的学历要求,可以看出以本科为主,硕士以上占一部分,女性普遍可以接受比自己学历稍低的男性,但最好还是跟自己水平相当。


反之,再来看一看男性对女性的学历要求,这个情况就比较有意思了,男性对于另一半的要求基本都是集中在本科。即使他自己是博士,也不会在征婚简历里面要求女方是硕士以上的学历。基本上大部分男性对于另一半的要求,都是本科学历即可,这个比例大概占到了75%。

 


还有一部分男性会提到,专科以上学历也是可以接受的。这个数据说明,男性在相亲的市场上对另一半的学历要求基本都是集中在本科,并非越高越好。


所以第一个表里的传闻,说女博士比较难在相亲市场上找到匹配的另一半,以此看来还是具有一定说服力的。

 

“属羊的?” “不要!”


 

最后一个话题就很有意思了,应该就是中国特色相亲理论:属相。

 

国外可能会说星座;在国内,这个属相里最奇葩就是说属羊的不要,属羊的女生坚决不行。属羊的人到底惹谁了?为什么这些相亲角里的大爷大妈们对于属羊的女性就那么不待见呢?

 

 

我也针对这个事情做了个小小的研究,当然这跟数据没什么关系。其实中国传统上对于属羊的人有种说法,就是叫十羊九不全。这个事情在明朝时的一些文献、小说、戏剧里面就已经存在了。

 

我们可以说它是迷信,但是有时在相亲市场上又不得不面对这些事情,虽然你不在乎,但别人在乎。之后我又想,能否找到一些数据来支持这个观点?然后我就去找了一下,但统计局上的数据并没有说属羊的,或是其它各个属相的人他们现在的婚姻状况如何,离婚率如何。

 


但是我找到了这样一个数据:2010年中国人口普查时,根据每个年龄段的数据,会发现属羊的人是最少的,相比出生人数最多的虎,属羊的人要少好几百万人。说明更多的父母会选择不让子女在羊年生孩子,再看2015年(羊年)的出生数据,会发现比前一年的出生人口要少32万人次。

 


从这里我们可以看出来,虽然网上很多人都在谈论属相,讨伐这些以属相来筛选相亲对象的人,但实际上他们自己可能也是其中的一分子,只是不说而已。

 

爱情是感情驱动的产物,并非数据驱动


综合前面的条件,结合这几个不同种类的调查,我们可以得出大多数男性最理想的另一半属性:本科以上学历、月收入5000到10000元左右、身高在1米59到1米63之间、年龄28岁左右、以教师、公务员等相对稳定的职业为主。男性在择偶这方面会更倾向于找一个顾家的女性,并不希望找一个女强人或是特别拼事业的女性。

 


女性理想的另一半属性则是:本科以上学历,硕士最好。月收入20000左右,身高1米75到1米80,年龄33岁左右,职业为外企或央企高管、公务员、医生等等。可以看出,女性在择偶方面第一点考虑的是安全感,她们最不喜欢的职业是像飞行员、演员这些特别不稳定的职业。

 


然后我们就把这些条件与之前得到的一些统计数据输入到某相亲网站上的筛选条件中,最后筛选出的“最受欢迎男性欢迎”总人数只占到所有相亲人数的10000分之7.6;对于女性来说就更难了,女性要找到一个最符合她们预期对象的概率是10000之1.4,基本上相当于万里挑一。

 

如果目前是单身状态的朋友,看到这里也不要觉得,怎么找对象是这么困难的事情?因为据另一个统计表明,大部分人的对象与当时设定条件完全匹配的只有11%。所以说大多数人,十成里面有九成的人找到对象,其实并不是与当时所罗列的众多条件完全相符。相亲或者爱情这个事情,它不是凭借数据来驱动的,终归还是一个感情驱动的过程,相信有情人会终成眷属。

 


故事到这里就暂且告一段落,我们用各类统计数据来讲了一个关于相亲的故事,它们原本都只是一些干巴巴的数据,但如果将它们变成更加直观的图表,我们就会更容易理解这些数据究竟是什么。


希望朋友们通过这次演讲能够有所收获,以后在看到朋友圈有趣见闻时可以想象它背后是不是有一些值得研究的地方,或是看到一些图表时也能尝试理解其背后的意思,谢谢大家!


-End-


新浪微博丨 @演绎inSite

今日头条丨 @演绎inSite

抖音丨   @演绎inSite

 

和我们一起保持探索世界的好奇。



扫描二维码或点击阅读原文

申请成为演绎inSite讲者


麻省理工科技评论

From Tech to Deeptech