2021华为杯数学建模D F 题思路

D题思路

1.第一题的本质的降维过程,对729个描述符,每个描述符有1974个数据,做去量纲后,PCA放到统一坐标下,SVD分解后找出对应特征值最大的前20个即可.
2.第二题可用神经网络的回归任务,1974个训练样本,使用MLP神经网络,输入为20维度的描述符,网络训练的监督信号为对应的pIC50值,网络层数不易过多,容易过拟合,构建3-5层网络差不多可以.
预测阶段,将test中描述符输出进去,模型输出结果即为最终值.
3.将上述认为修改为分类任务即可,网络输出为729维度的特征向量,网络输出值为5维度向量,对应的ADMET的5个变量.
4.该题将前几个任务结合,寻找最优解问题,ADMET为5维度的向量,可自行设计一个打分机制,将训练样本的ADMET打分变成1维度值.
问题变为寻找729个描述符中的标量使得生物活性值和ADMET值较好.
较为简单的方法,使用3中的模型,对每个描述符冻结,用其他的做训练,训练集中分出一部分做测试样本(如74个),训练完成后,在inference阶段,对冻结的描述符值进行修改,观察其对最终结果的影响,同事可以调整其变化范围,找到改变范围和重要性.

F题思路

问题1.模型建立
1.参数向量化,针对描述性的语言,用参数进行表示
2.针对时间和地点进行编码操作,模型求解完成后相应的解码操作即可.如题中的时间,航班号,起飞和到达时间等.
3.相应的参数化完成后,确定模型的解的编码值,添加问题中的约束,变为最优化问题.cost-function构建可用题中给出的目标,对三个目标做权重分配.
模型构造完成后,可以遗传算法求最优解.

问题2.同上模型,添加更多的约束,对目标函数添加另外两个cost.

问题3.同上模型,添加对应的约束和目标函数.

你可能感兴趣的