Skip to content

Latest commit

 

History

History
70 lines (52 loc) · 1.97 KB

百度垂搜算法.md

File metadata and controls

70 lines (52 loc) · 1.97 KB

百度垂直行业搜索部

一面

  • 介绍项目

  • 特征怎么确定用什么

  • 用了什么举例子

  • 特征筛选的方法

  • 遗传算法怎么做的

  • 有什么优点缺点为啥不用别的特征筛选方法

  • Svm的原理

  • 和其他比如逻辑回归的区别?

  • 学过啥

  • Sort sorted区别 list.sort改变原始列表顺序 sorted不改变原始列表,而是产生新列表,而且可以对所有可迭代对象排序

  • 引用和指针的区别

  • 堆栈 进程线程区别

  • 代码 两个数组去重

  • 代码

    • 推荐算法 大维度的用户数据和商品数据 计算 矩阵的方法
  • 代码

    • 给几个特征和标签,怎么筛选有用的特征,只用过滤法。可以用auc进行评价
  • Auc怎么计算

  • 先不考虑数据预处理

  • 最后没写具体的

二面

  • 介绍了一下部门的业务是什么

  • Adaboost的强弱为什么这么做 原理

    • 怎么做的
    • 伪代码步骤
    • 和xgbost区别
    • 分类器为啥只能用决策树这样简单的
  • 聚类的方法都有什么

  • Kmeans的流程方法停止条件

  • 堆栈 不同的数据结构 线程进程

  • 会什么东西和部门工作可以结合的

  • 遗传算法的原理步骤

  • 代码

    • 数组复制
    • 需要注意的边界条件
  • 概率问题:如何产生产生等概率数的东西

三面

  • 介绍一下项目,遇到什么困难

  • 实习做了什么,实习怎么从零开始,遇到的最大的困难是什么

  • 上线一个输入推荐的功能的全部流程的设计,需要什么数据,可以先想一下再讲

  • 模型和数据怎么存储 分开存 模型太大怎么办 好像mr也不对。。

  • 学过什么课,计算机基础的都学过不 算法 计算机原理 操作系统

  • Tcp dlp的区别?后面那个没听过…

  • 代码

    • 两个有序数组找到重复的数字交运算,只能c不能Python
    • 测试用例怎么设计
  • 怎么选择offer

  • 有面其他的不

  • 个人优缺点

  • 还有什么问题 部门做什么