于2021.6.15正式创立这个文件夹,开始学习这本书,2024年上传github,和之前学的《机器学习实战》不同的是,这次我用的jupyter notebook作为载体记录,因为觉得这样文字描述和代码在一块放着好看,比放纯代码文件+readme好看一些。这本书非常棒,书本身也可作为 ...
一般而言salary列的值比较混乱,有数字有字符串,我们需要加工薪水数据,把薪水的上限下限隔离出来,以便于统计。观察可得,大部分的薪水是含有上下限的,单位为小写的千或万,中间用“-”作为连接的字符串,个别职位会出现“面议”的描述。这里用apply ...