lu161513 a54fdd2bf5 增加sql解释和readme | 2 anni fa | |
---|---|---|
common | 2 anni fa | |
.gitignore | 2 anni fa | |
README.md | 2 anni fa | |
data_analysis.py | 2 anni fa | |
data_analysis_0213.py | 2 anni fa | |
data_analysis_new.py | 2 anni fa | |
data_join.py | 2 anni fa | |
data_preprocess.py | 2 anni fa | |
deep_test.py | 2 anni fa | |
example_data.py | 2 anni fa | |
local_process.py | 2 anni fa | |
local_process_deep.py | 2 anni fa | |
test.py | 2 anni fa | |
train.py | 2 anni fa | |
train_local.py | 2 anni fa | |
~$字段及其含义.xlsx | 2 anni fa | |
字段及其含义.xlsx | 2 anni fa | |
快手产品数据分析.docx | 2 anni fa | |
数据分析2.docx | 2 anni fa | |
数据库sql及其解释.txt | 2 anni fa |
使用sql脚本中首先提取出6月正样本、负样本的ID,存于l_pos_uuid_06和l_neg_uuid_06中, 再用这两个ID关联出原始数据存于l_pos_origin_06和l_neg_origin_06中 然后再使用python脚本 data_preprocess.py处理正样本 example_data.py处理负样本 两个文件可以根据代码,将预处理后的数据写入数据库,或者存于本地pkl中,我会存于pkl中,这样训练时候省得再从数据库读取 data_analysis_new.py用于数据分析绘图 local_process.py用于训练模型,验证模型
验证模型使用7、8月份的数据,按照之前准备6、7月份数据的方法准备一遍即可