详情页面-竞赛圈

已有账号，去登录

注册

点击左侧图标，发送手机验证码

我已阅读并同意《DC竞赛服务规则》和《DC竞赛隐私权政策》

使用邮箱注册

我已阅读并同意《DC竞赛服务规则》和《DC竞赛隐私权政策》

使用手机注册

第三方登录

验证邮箱

我们已向您的注册邮箱发送了一封邮件，请您注意接收邮件

好的，现在就去

请注意查收邮件，并按照邮件中的提示操作，完成注册。
没有收到邮件？请注意查看邮箱垃圾箱或重新发送

恭喜您

成为第位DCer
现在就去完善资料,参与平台更多活动吧!

好的,现在就去

YRomg

业务数据分析师 | C/C++

关注者 18

关注了

import pandas as pd, numpy as np from sklearn.linear_model import LogisticRegression from sklearn.feature_extraction.text import CountVectorizer, TfidfVectorizer import time t1=time.time() train = pd.read_csv('../input/train_set.csv') test = pd.read_csv('../input/test_set.csv') test_id = pd.read_csv('../input/test_set.csv')[["id"]].copy() column="word_seg" n = train.shape[0] vec = TfidfVectorizer(ngram_range=(1,2),min_df=3, max_df=0.9,use_idf=1,smooth_idf=1, sublinear_tf=1) trn_term_doc = vec.fit_transform(train[column]) test_term_doc = vec.transform(test[column]) y=(train["classify"]-1).astype(int) clf = LogisticRegression(C=4, dual=True) clf.fit(trn_term_doc, y) preds=clf.predict_proba(test_term_doc) #保存概率文件 test_prob=pd.DataFrame(preds) test_prob.columns=["class_prob_%s"%i for i in range(1,preds.shape[1]+1)] test_prob["id"]=list(test_id["id"]) test_prob.to_csv('../sub_prob/prob_lr_baseline.csv',index=None) #生成提交结果 preds=np.argmax(preds,axis=1) test_pred=pd.DataFrame(preds) test_pred.columns=["class"] test_pred["class"]=(test_pred["class"]+1).astype(int) print(test_pred.shape) print(test_id.shape) test_pred["id"]=list(test_id["id"]) test_pred[["id","class"]].to_csv('../sub/sub_lr_baseline.csv',index=None) t2=time.time() print("time use:",t2-t1)

登录

第三方登录

注册

第三方登录

验证邮箱

恭喜您

手机账号绑定

联系DC

tfidf+lr lb：0.77256

YRomg

YRomg

请选择举报原因：