`
nkliuliu
  • 浏览: 207217 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论
文章列表
      年前在考虑搞个关键扩词工具,如果直接抓取google的相关搜索。用不了几次就别封ip了,设了抓取间隔时长也没用(也可能设的时候太短),没办法只能抓取代理ip了,便有了下面的小demo。可惜的是网络资源还是太少,不够抓的,真正能用的代理ip没几个。根本形不成可用的规模。代码如下给可能用到的人做个参考吧: package com.emar.spider; import java.util.HashMap; import java.util.Map; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; imp ...
      最近负责公司的sem技术这块,此前没有相关的业务经验。走了不少弯路。现在公司想通过技术手段来实现关键词竞价的自动优化。因为不了解这块同行业的情况。所以迟迟也动手编写。而且思路也不是很清晰。现在想了几条规则且程序可实现的如下:        1.把转化较低的关键词都停掉,ROI自然提高了。(缩减下词)        2.自动上账号相关关键词,可以利用百度关键词推荐系统自动上词。(扩词上词)        3.自动添加某个效果好的广泛匹配的关键词的否定关键词,否定关键词效果可以通过系统自动上精确匹配来实现效果跟踪。(缩减下词)        4.特定词自动调价,保证百度前三位。定 ...
报错信息: 2011-01-10 16:10:29 [org.apache.axis2.transport.http.HTTPSender]-[INFO] Unable to sendViaPost to url[https://api.baidu.com/sem/sms/v2/KeywordService] java.net.SocketTimeoutException: Read timed out at java.net.SocketInputStream.socketRead0(Native Method) at java.net.SocketInputStream.read ...
在本专栏的上一篇文章POM重构之增还是删中,我们讨论了一些简单实用的POM重构技巧,包括重构的前提——持续集成,以及如何通过添加或者删除内容来提高POM的可读性和构建的稳定性。但在实际的项目中,这些技巧还是不够的,特别值得一提的是,实际的Maven项目基本都是多模块的,如果仅仅重构单个POM而不考虑模块之间的关系,那就会造成无谓的重复。本文就讨论一些基于多模块的POM重构技巧。 重复,还是重复 程序员应该有狗一般的嗅觉,要能嗅到重复这一最常见的坏味道,不管重复披着怎样的外衣,一旦发现,都应该毫不留情地彻底地将其干掉。不要因为POM不是产品代码而纵容重复在这里发酵,例如这样一段代码就有重复: ...
查看当前目录下文件的个数   ls -l | grep "^-" | wc -l   查看当前目录下文件的个数,包括子目录里的。 ls -lR| grep "^-" | wc -l   查看某目录下文件夹(目录)的个数,包括子目录里的。   ls -lR| grep "^d" | wc -l   简要说明: ls -l 长列表输出该目录下文件信息(注意这里的文件,不同于一般的文件,可能是目录、链接、设备文件等) grep "^-" 这里将长列表 ...
导读: 西门子中国中央研究院首席架构师、图书《架构之美——软件架构的艺术》作者李伟,从架构师的定义和内涵、能力和素质要求、成长途径等方面向您阐述成为一个真正的… 西门子中国中央研究院首席架构师、图书《 ...
导读: 主持人冯大辉,阿里巴巴集团旗下支付宝(中国)网络科技有限公司数据库架构师,负责支付宝数据库架构规划、解决方案等相关工作。提问嘉宾岳旭强,淘宝网资深架构… 主持人 冯大辉 ,阿里巴巴集团旗下支 ...
DAO 模式对任何企业 Java 开发人员来说都应该很熟悉。但是模式的实现各不相同,所以我们来澄清一下本文提供的 DAO 实现背后的假设: 系统中的所有数据库访问都通过 DAO 进行以实现封装。 每个 DAO 实例负责一个主要域对象或实体。如果域对象具有独立生命周期,它应具有自己的 DAO。 DAO 负责域对象的创建、读取(按主键)、更新和删除(creations, reads, updates, and deletions,CRUD)。 DAO 可允许基于除主键之外的标准进行查询。我将之称为查找器方法 或查找器 。查找器的返回值通常是 DAO 负责的域对象集合。 DAO 不负 ...
      在 Web 应用开发中,安全一直是非常重要的一个方面。安全虽然属于应用的非功能性需求,但是应该在应用开发的初期就考虑进来。如果在应用开发的后期才考虑安全的问题,就可能陷入一个两难的境地:一方面,应用存在严重的安全漏洞,无法满足用户的要求,并可能造成用户的隐私数据被攻击者窃取;另一方面,应用的基本架构已经确定,要修复安全漏洞,可能需要对系统的架构做出比较重大的调整,因而需要更多的开发时间,影响应用的发布进程。因此,从应用开发的第一天就应该把安全相关的因素考虑进来,并在整个应用的开发过程中。       本文详细介绍了如何使用 Spring Security 来保护 Web 应用的安 ...
        在上周六淘宝网和阿里巴巴B2B联合主办、InfoQ独家社区支持的第二届互联网测试交流大会 上,来自Google、Baidu、网易、腾讯、淘宝、阿里巴巴、FreeWheel等公司的测试经理分别分享了他们在测试领域的心得体会,原计划500人的会场到会了800人。在讲师交流环节,大家对“研发团队中最合适的开发测试比是多少”话题做了讨论。(编辑注: 方便起见,本文对各测试经理均使用花名,请勿对号入座!) 郭靖是某大型网上商城测试团队的负责人,自2003年加入公司后就组建了该网站的测试团队,推动团队进行性能测试、自动化测试、接口测试等。随着团 队的壮大,他遇到的比较头疼的问题是一个 ...
       重构是广大开发者再熟悉不过的技术,在Martin Fowler的《重构——改善既有代码的设计》 一 书中,其定义为“重构(名词):对软件内部结构的一种调整,目的是在不改变软件之可察行为前提下,提高其可理解性,降低其修改 ...
      在2010年的QCon北京大会上,InfoQ的编辑对人人网产品技术高级总监黄晶进行了采访,其中他谈到了关于人人网从校内到现在所做的架构上的转变,还谈到了人人网创建并使用的两个开源项目。       黄晶,清华大学计算机系硕士,曾在天人互动游戏公司、空中网、千橡互动任职,现任千橡互动集团人人网产品技术高级总监,负责人人网产品规划和研发。 投身 Web2.0和SNS事业,秉承以用户价值为核心的理念,推崇以简约架构取得最大收益的技术路线,积极推动互联网开放平台和开源项目的发展和应用,带领人 人网产品技术团队,实现人人网的稳健高速发展。   InfoQ:大家好,经常 ...
       我们在用maven和eclipse开发WEB应用的时候,需要把 servlet-api和jsp-api加入进来,要不然编译不会通过,加入进来之后在打包的时候maven自动把所有的依赖包都放到lib下面,如果你 在tomcat下面运行就会有问题,因为tomcat发现你的web应用的lib中包含了servlet-api,他会报错。   validateJarFile(D:\springsource\apache-tomcat-6.0.24\wtpwebapps\semwinner\WEB-INF\lib\servlet-api-2.5.jar) - jar not load ...
      很高兴在杭州的淘宝研发中心来采访伏威,伏威你好。       你好。       其实到现在为止距离淘宝双十一事件已经过去蛮多天了,但在整个技术圈里 面大家还是津津乐道。我这 ...
       当今从纯网站技术上来说,因为开源模式的发展,现在建一个小网站已经很简单也很便宜,所以很多人都把创业方向定位在互联网应用。这些人里大多数不是 很懂技术,或者不是那么精通,而网站开发维护方面的知识又很分散,学习成本太高,所以这篇文章将这些知识点结合起来,系统的来说,一个从日几千访问的小小 网站,到日访问一两百万的小网站,中间可能会产生什么问题,以及怎么才能在一开始做足工作尽量避免这些问题。       你的网站因为努力经营,访问量逐渐升高,在升高的过程中,问题也可能开始显现了。因为带宽的增加、硬件的扩展、人员的扩张所带来的成本提高是显而易 见的,而还有相当大的一部分成本是因为代 ...
Global site tag (gtag.js) - Google Analytics