首页
赋能研发资源
我们可以按照单独工作室形式承接项目,亦可以通过多个开发者形式补充到客户的开发团队,协助客户敏捷化的IT资源调度。
-
技术栈包括:Python/Clojure/Haskell/ELM。
- Python 性能优化
- 数据类型优化 numpy/pandas/ctypes/
- 多任务优化 asyncio/threading/multiprocessing
- Python 类型化
- 针对大型内部Python项目进行类型化,便于维护和拓展
- 前端开发 Reframe/Reagent(ClojureScript)
- 敏捷报表 ELM/Dash/pywebio
- 大数据处理 Celery
- 决策引擎 Haskell
- Python 性能优化
-
服务内容包括:
- 功能开发,系统集成
- 代码评审 & 自动化测试
数据处理
通过对客户的业务理解,利用现有的工具对数据进行建模,解析(包括批量OCR),清洗,归一化后载入数据仓库,通过建立数据报表和决策引擎,协助客户对业务进行分析/决策。
交付方式可以通过专用web端口进行数据操作,或者部署到客户内网环境确保敏感数据不会外泄。
案例1: PDF解析: 客户每月需要处理分析数百个PDF文件: 其中包括混合字符型PDF和图片型PDF。 我们通过Python对PDF进行本地文字抽取,通过正则表达式进行数据清洗;对于图片PDF,我们通过本地库文件进行图像解析,对解析后的结果进行数据对齐等整理操作。最后通过版本管理的方式对解析结果进行持久化管理。 对于数据呈现方面,我们建立可配置的web界面对数据进行上钻下取,协助客户对数据进行校验,以及进行探索性分析。
案例2: 自动数据抓取/处理: 客户每次通过上传一个excel BOM文件,我们通过读取内容,自动从网上抓取BOM清单内相关信息,并且生成采购订单提供下载。