深入你的语言
Program into Your Languages

框架

关于烂代码的那些事 - 为什么每个团队存在大量烂代码

matthew阅读(793)评论(0)

秦迪,微博研发中心技术专家,2013 年加入微博,负责微博平台通讯系统的设计和研发、微博平台基础工具的开发和维护,并负责微博平台的架构改进工作,在工作中擅长排查复杂系统的各类疑难杂症。爱折腾,喜欢研究从内核到前端的所有方向,近几年重点关注大...

IK分词器原理与源码分析

matthew阅读(887)评论(0)

引言 做搜索技术的不可能不接触分词器。个人认为为什么搜索引擎无法被数据库所替代的原因主要有两点,一个是在数据量比较大的时候,搜索引擎的查询速度快,第二点在于,搜索引擎能做到比数据库更理解用户。第一点好理解,每当数据库的单个表大了,就是一件头...

Joyent CTO谈容器在2016年亟需改变的问题

matthew阅读(840)评论(0)

为了在云时代取得领先地位,Joyent 将赌注压在容器上。本文由 Joyent CTO Bryan Cantrill 接受 TechTarget 采访,深度介绍关于容器技术 2015 年的现状和亟需改变的问题。 Joyent 在过去的十年中...

微博基于Docker的混合云平台设计与实践

matthew阅读(822)评论(0)

王关胜,微博研发中心运维架构师。2011 年初加入新浪,一直负责微博平台&大数据等业务线的运维保障工作,包括产品稳定性,运维基础设施建设,工具建设等。致力于推进 Docker 在微博的应用,参与建设微博混合云平台 DCP。擅长大规模...

深入理解同步/异步与阻塞/非阻塞区别

matthew阅读(808)评论(0)

「那谁」,codedump.info 博主,多年从事互联网服务器后台开发工作。 几年前曾写过一篇描写同步/异步以及阻塞/非阻塞的文章,最近再回头看,还存在一些理解和认知误区,于是重新整理一下相关的概念,希望对网络编程的同行能有所启发。 同步...

大数据盘点之Spark篇

matthew阅读(904)评论(0)

谭政,Hulu 网大数据基础平台研发。曾在新浪微博平台工作过。专注于大数据存储和处理,对 Hadoop、HBase 以及 Spark 等等均有深入的了解。 Spark 最新的特性以及功能 2015 年中 Spark 版本从 1.2.1 升级...

Lucene5学习之QueryParser-Query解析器

matthew阅读(864)评论(0)

Lucene已经给我们提供了很多Query查询器,如PhraseQuery,SpanQuery,那为什么还要提供QueryParser呢?或者说设计QueryParser的目的是什么?QueryParser的目的就是让你从众多的Query实...

Lucene5学习之排序

matthew阅读(716)评论(0)

这回我们来学习Lucene的排序。机智的少年应该已经发现了,IndexSearcher类的search方法有好几个重载: /** Finds the top <code>n</code> * hits for <...

Lucene5学习之自定义同义词分词器简单示例

matthew阅读(463)评论(0)

同义词功能在全文搜索时的意义,大家应该都懂的。今天中文我就试着写了一个同义词分词的示例demo,其实主要代码还是参考Lucene in Action 这本英文版书籍的随书代码,只不过Lucenen in Action书里的示例代码目前最新版...

Lucene5学习之多索引目录查询以及多线程查询

matthew阅读(492)评论(0)

上一篇中我们使用多线程创建了索引,下面我们来试着采用不把多个索引目录里的数据合并到一个新的索引目录的方式去查询索引数据,当然你也可以合并(合并到一个索引目录查询就很简单了),其实很多情况我们都是不合并到一个索引目录的,那多索引目录该如何查询...