科技部落

  • 信也科技持续集成解决方案

    背景 随着信也科技业务的不断发展,公司的应用越来越多,产品的迭代也越来越频繁。过去,一个团队的开发人员可能会孤立地工作很长一段时间,只有在他们的工作完成后,才会将他们的更改合并到主…

    1天前 38 0
  • 让机器人听听你的方言,就能识别你是哪里人!

    语言是文化的载体,也是交流的工具。互联网将全球连接得越来越紧密,各种语种之间的交流越来越频繁。作为语种间交流的基础,自动语种辨识的需求越来越广泛。即使在中国国内,同是汉语,不同方言…

    3天前 26 0
  • 数据高效处理的秘诀——Kudu实战

    背景 使用Kudu之前,我们的Online Report采用都HDFS/Parquet on Impala的架构,数据每隔一小时通过MapReduce从生产db增量同步到HDFS,…

    6天前 38 0
  • 反爬虫攻防实战——字体篇

    自从互联网大数据开始崭露头角之际,爬虫与反爬虫就成了业界永恒的话题,在这个资讯爆炸的时代占有一席之地。 有道是“道高一尺,魔高一丈”。你有动态验证,我有请求伪装。你有动态渲染,我有…

    2020年11月19日 39 0
  • Spark成长日记-从小白到通吃

    为什么选择Spark 随着业务的发展, 现行数仓的一些工作模式已经无法满足新的业务场景, 这些问题促使我们开始尝试使用一些新的技术和工具。 Apache Spark是专为大规模数据…

    2020年11月18日 41 0
  • 浅谈社区发现算法

    导语 本文简单介绍了一些社区发现算法,希望各位读者能够对于关系网络的人群切分有一些初步的了解。 首先我们解释一下什么是社区发现。举个简单的例子,一个班级中有些同学喜欢数学,有些同学…

    2020年11月18日 39 0
  • 拒绝调包!且看MTCNN人脸检测推断过程详解!

    背景介绍: 人脸检测,解决两个问题:1)识别图片中有没有人脸?2)如果有,人脸在哪?因此,许多人脸应用(人脸识别、面向分析)的基础是人脸检测。 大多数人脸检测采用的流程为两阶段: …

    2020年11月17日 39 0
  • ALV模型在用户估值和信用决策中的应用

    ALV模型是什么,应用在哪? Account Level Valuation (ALV)模型,是广泛应用于美国银行业信用风险管理的一套模型,通过估计信用贷款在贷款周期内的价值,进行…

    2020年11月13日 46 0
  • 模型服务管理平台 – Waterdrop 之弹性伸缩

    前言 Waterdrop 是一个模型服务管理平台,它有以下功能: 自动服务化: 自动将模型代码封装为 API 服务 容器服务: 使用 Docker 镜像封装环境…

    2020年11月12日 47 0
  • 多外部数据源的智能化调用策略

    现如今,常规的机器学习算法可以接受上千维的特征输入,这些特征可能来自不同的外部数据源,每次使用特定模型进行样本预测时,需要同时调用所有用到的数据源,不同数据源的接口调用,不仅存在调…

    2020年11月11日 59 0