4 迎接2021年高考,是时候做高考志愿填报数据准备工作了

重要说明
【1】本系列图文均覆盖本科招生、不覆盖大专招生;【2】本系列图文适用于“原高考”模式、“3 1 2新高考”模式 。对于“3 3”高考模式仅有借鉴参考意义,请勿直接应用 。


前情提要
前文回答了“灵魂三问”:为什么要准备数据(Why)、何时准备数据(When)、要准备什么数据(What) 。本文回答第四问:如何准备数据(How) 。
【核心提要】要准备的数据为关键数据 , 包括:高考总分排位、高校及专业录取排位、高校及专业录取人数、高校及专业的质量
前文《迎接2021年高考,是时候做高考志愿填报的数据准备工作了(2)》~(3)回答了“如何准备数据”的两个阶段之一的“数据粗筛”阶段要做的部分工作 。
【核心提要】数据准备划分为“数据粗筛阶段”、“数据细化阶段”;粗筛阶段的“分数统计表”整理方法、高考总分排位预估、高校及专业质量数据、“前一年高校最低录取分排位数据”整理方法 。
本图文完成粗筛阶段“整合数据、筛选满足要求的高校”部分的讲解 。

数据粗筛阶段:数据整合

数据整合的目的是便于后续高校筛选、专业选择等使用 。但数据整合需要一定的软件技能:一方面,上述各类数据格式各异,有PDF、图片、网页等,需要通过格式转换和清洗形成同样格式的数据;另外一方面,需要将这些数据关联到一起便于使用 。
对于不具备软件技能的家长,也没有什么大问题 。采用“人工”方式关联查阅相关数据也是可以的,无非麻烦点 。
对于具备一定软件技能的家长,笔者简单说一下数据整合的思路:1)使用各类小工具将上述数据转换为统一的CSV等格式;2)使用Excel或WPS等工具对数据进行关联(VLOOKUP函数) 。
当然假设软件技能强悍,无需笔者多言:Python、SQL/NoSQL数据库均可以使用起来 。
在进行数据关联时,需要确定“主数据”,建议按照如下方法选择“主数据”:
?对于“原高考”模式省份:以“前一年高校最低录取分排位”作为主数据,关联高校质量数据(地域和高校评级);
?对于“3 1 2高考”模式省份:以“普通高校本科专业选考科目要求”作为主数据 , 关联“前一年高校最低录取分排位”、高校质量数据(地域和高校评级)、专业质量数据(学科评估) 。
在《迎接2021年高考:是时候做高考志愿填报的数据准备工作了(二)》一文中,说明了为何不在“数据粗筛”阶段整理选科要求数据,建议是在“数据细化阶段”再通过选科要求对本阶段选出的高校进一步筛选 。而这里提出以选科要求作为“主数据”,原因是无论如何都是需要整合选科要求数据的,因此可在这里一并完成 。
以广东省为例,可形成如下的整合后的数据(Excel格式):
4 迎接2021年高考,是时候做高考志愿填报数据准备工作了

点击图片查看大图
基于整合后的数据,可以很容易完成高校的筛选、完成本阶段的任务 。比如,如下视频演示了筛选出:最低录取分排位在2000~10000、地处一线城市、211及以上层次、可满足选科组合为物理 化学 生物的所有高校的过程:
除了军校外,同一个高校有可能在多个批次中均进行招生 。各个数据筛选出的高校加以合并即可;
步骤二:按照个人对高校质量的要求,使用“高校质量数据”,从上述筛选出的高校中进一步过滤不满足要求的学校 。
【4 迎接2021年高考,是时候做高考志愿填报数据准备工作了】假设已有整合数据:
1)上述步骤可以使用Excel或WPS的筛选功能完成;
2)对于“3 1 2”高考模式省份,可以借助整合数据同时考虑选科要求筛选学校 。
至此,“数据粗筛阶段”完成 。

未完待续:精彩预告
数据细化阶段
这一阶段的任务是:
...
本文由老张聊IT和教育原创,欢迎关注,带你一起长知识!

相关经验推荐