- 上一篇完成了百度MP3大类和小类的解析抽取,进一步需要进行歌曲资源抽取。例如抽取某个歌手的所有热歌,这里需要注意一点:url中如果包含有中文字符或者其他的一些特殊字符,例如空格,需要进行处理否则无法连接到网页(使用URLConnection)。比如http://mp3.baidu.com/singerlist/周杰伦.html 。这里使用了一下代码进行处理:
- try{
-
mOnlineURL=mOnlineURL.replaceAll("/","_").replace(":","_");
-
mOnlineURL=(URLEncoder.encode(mOnlineURL,"UTF-8").replace("___","://").replace("_","/"));
-
returnmatch(newURL(mOnlineURL),rex,otherColums);
-
}catch(MalformedURLExceptione){
try {
mOnlineURL = mOnlineURL.replaceAll("/", "_").replace(":", "_");
mOnlineURL = (URLEncoder.encode(mOnlineURL, "UTF-8").replace("___", "://").replace("_", "/"));
return match(new URL(mOnlineURL), rex, otherColums);
} catch (MalformedURLException e) {
经过以上url的处理,给出歌手的正则表达式:
- Matchermatcher=Pattern
- .compile(
-
"<ahref=/"#/"class=/"p/"onclick=/"returnplayAll//((//d*?)//)/">.*?</a>.*?target=/"_blank/">(.*?)</a>")
- .matcher(sb);
Matcher matcher = Pattern
.compile(
"<a href=/"#/" class=/"p/" onclick=/"return playAll//((//d*?)//)/">.*?</a>.*?target=/"_blank/">(.*?)</a>")
.matcher(sb);
得到如下的结果:
- 14辑-美人啊bonamana完整版
- 2sorry,sorryposter
- 3the2ndasiatourconcertalbumsupersh
- 4the2ndasiatourconcertalbumsupersh
- 5the2ndasiatourconcertalbumsupersh
- 6the2ndasiatourconcertalbumsupersh
- 7supershow1stasiatouralbum
- 84辑-美人啊bonamana完整版
- 9美人啊bonamana
1 4辑-美人啊bonamana完整版
2 sorry, sorry poster
3 the 2nd asia tour concert album super sh
4 the 2nd asia tour concert album super sh
5 the 2nd asia tour concert album super sh
6 the 2nd asia tour concert album super sh
7 super show 1st asia tour album
8 4辑-美人啊bonamana完整版
9 美人啊bonamana
这时只需两个参数(歌曲名和歌手)就可以通过百度给的api得到歌曲资源,见http://cloud21.javaeye.com/blog/611914中关于api的使用。
- <result>
-
<count>5</count>
- −
-
<url>
- −
-
<encode>
- http://zhangmenshiting.baidu.com/service/k2eZl25omWqWa5lnZpyZa2Jol5mZappuamtsZmtomWlfn6NndK6ap5WXcGyWZm5vYmplmW1ncGhqmGRlmJlsmpdkmGybnGpoaWqUZ5s2
-
</encode>
- −
-
<decode>
-
b5fc92b2e9f31fb316ded4c6999262b1.mp3?xcode=8a077182e81909f11cc5bf2e8ff3088a3f
-
</decode>
-
<type>8</type>
-
<lrcid>915420</lrcid>
-
</url>
- −
-
<url>
-
<encode>http://bbs.snrx.net/mp3/mZenlaOdsK2WpZg0.mp3</encode>
-
<decode>hetangyuese.mp3</decode>
-
<type>1</type>
-
<lrcid>915420</lrcid>
-
</url>
- −
-
<url>
- −
-
<encode>
- http://file.qlteacher.com/upload/cz2010/medias/1008/06/YmdlZ2pubmlhMg$$.mp3
-
</encode>
-
<decode>152358710.mp3</decode>
-
<type>1</type>
-
<lrcid>915420</lrcid>
-
</url>
- −
-
<url>
-
<encode>http://www.yxdlc.com/music/ajI$.mp3</encode>
-
<decode>9.mp3</decode>
-
<type>1</type>
-
<lrcid>915420</lrcid>
-
</url>
- −
-
<url>
-
<encode>http://lt.dd-99.com/mp3/lGhsbW5obWqTYzM$.mp3</encode>
-
<decode>c6999262b1.mp3</decode>
-
<type>1</type>
-
<lrcid>915420</lrcid>
-
</url>
-
</result>
<result>
<count>5</count>
−
<url>
−
<encode>
http://zhangmenshiting.baidu.com/service/k2eZl25omWqWa5lnZpyZa2Jol5mZappuamtsZmtomWlfn6NndK6ap5WXcGyWZm5vYmplmW1ncGhqmGRlmJlsmpdkmGybnGpoaWqUZ5s2
</encode>
−
<decode>
b5fc92b2e9f31fb316ded4c6999262b1.mp3?xcode=8a077182e81909f11cc5bf2e8ff3088a3f
</decode>
<type>8</type>
<lrcid>915420</lrcid>
</url>
−
<url>
<encode>http://bbs.snrx.net/mp3/mZenlaOdsK2WpZg0.mp3</encode>
<decode>hetangyuese.mp3</decode>
<type>1</type>
<lrcid>915420</lrcid>
</url>
−
<url>
−
<encode>
http://file.qlteacher.com/upload/cz2010/medias/1008/06/YmdlZ2pubmlhMg$$.mp3
</encode>
<decode>152358710.mp3</decode>
<type>1</type>
<lrcid>915420</lrcid>
</url>
−
<url>
<encode>http://www.yxdlc.com/music/ajI$.mp3</encode>
<decode>9.mp3</decode>
<type>1</type>
<lrcid>915420</lrcid>
</url>
−
<url>
<encode>http://lt.dd-99.com/mp3/lGhsbW5obWqTYzM$.mp3</encode>
<decode>c6999262b1.mp3</decode>
<type>1</type>
<lrcid>915420</lrcid>
</url>
</result>
得到这个xml档案后,使用以下程序进行解析并组合出一条url(每次只挑选第一个url作为歌曲资源,这里不是很合理,理想的挑选方法时ping出所有歌曲资源的响应速度并选择响应速度最快的歌曲资源作为最终资源)
- publicstaticStringparserToUrl(Stringname,Stringartist){
-
Stringurl="";
-
try{
- Stringorginurl=Parameter.MUSIC_PATH_REX.replace(
-
"("+MediaStore.OnLine.NAME+")",URLEncoder.encode(name,"UTF-8")).replace(
-
"("+MediaStore.OnLine.ARTIST+")",URLEncoder.encode(artist,"UTF-8"));
-
Log.v(OnlineParser.class.getName(),orginurl);
-
URLConnectionconnection=(newURL(orginurl)).openConnection();
-
connection.setConnectTimeout(10000);
-
connection.addRequestProperty("User-Agent","Chrome/5.0.37");
- connection.connect();
- InputStreamstr=connection.getInputStream();
-
- DocumentBuilderdocBuilder=DocumentBuilderFactory.newInstance()
- .newDocumentBuilder();
- Documentdoc=docBuilder.parse(str);
-
NodeListnodelist=doc.getElementsByTagName("url");
-
for(inti=0;i<nodelist.getLength();){
- NodeListchildren=nodelist.item(i).getChildNodes();
-
Stringencode=children.item(0).getTextContent();
-
Stringdecode=URLEncoder.encode(children.item(1).getTextContent(),"UTF-8");
-
url=encode.substring(0,encode.lastIndexOf("/")+1)+decode;
-
returnurl;
- }
-
}catch(MalformedURLExceptione){
- e.printStackTrace();
-
}catch(IOExceptione){
- e.printStackTrace();
-
}catch(ParserConfigurationExceptione){
- e.printStackTrace();
-
}catch(SAXExceptione){
- e.printStackTrace();
- }
-
returnurl;
- }
-
-
publicclassParameter{
-
publicstaticfinalStringMUSIC_PATH_REX="http://box.zhangmen.baidu.com/x?op=12&count=1&title=("+MediaStore.OnLine.NAME+")$$("+MediaStore.OnLine.ARTIST+")$$$$";
- }
public static String parserToUrl(String name, String artist) {
String url = "";
try {
String orginurl = Parameter.MUSIC_PATH_REX.replace(
"(" + MediaStore.OnLine.NAME + ")", URLEncoder.encode(name,"UTF-8")).replace(
"(" + MediaStore.OnLine.ARTIST + ")",URLEncoder.encode(artist,"UTF-8"));
Log.v(OnlineParser.class.getName(), orginurl);
URLConnection connection = (new URL(orginurl)).openConnection();
connection.setConnectTimeout(10000);
connection.addRequestProperty("User-Agent", "Chrome/5.0.37");
connection.connect();
InputStream str = connection.getInputStream();
DocumentBuilder docBuilder = DocumentBuilderFactory.newInstance()
.newDocumentBuilder();
Document doc = docBuilder.parse(str);
NodeList nodelist = doc.getElementsByTagName("url");
for (int i = 0; i < nodelist.getLength();) {
NodeList children = nodelist.item(i).getChildNodes();
String encode = children.item(0).getTextContent();
String decode =URLEncoder.encode(children.item(1).getTextContent(),"UTF-8");
url = encode.substring(0, encode.lastIndexOf("/")+1)+decode;
return url;
}
} catch (MalformedURLException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} catch (ParserConfigurationException e) {
e.printStackTrace();
} catch (SAXException e) {
e.printStackTrace();
}
return url;
}
/////////
public class Parameter {
public static final String MUSIC_PATH_REX="http://box.zhangmen.baidu.com/x?op=12&count=1&title=("+MediaStore.OnLine.NAME+")$$("+MediaStore.OnLine.ARTIST+")$$$$";
}
- StreamStarter:android源码中的音乐播放器已经实现了在线播放的功能,该类就是StreamStarter。这里需要的注意的是当启动该activity时,要设置以下数据
- Uriuri=getIntent().getData();
Uri uri = getIntent().getData();
将歌曲的url资源植入次activity。
虽然实现了在线播放,可存在一个问题当离开播放界面后歌曲也自动停止播放,明明已经启动了后台的service......可能是未创建缓冲数据,在研究研究(待续)
分享到:
相关推荐
pathBuilder.append(entry.getKey()).append("=").append(URLEncoder.encode(entry.getValue())).append("&"); } //http://192.168.12.100:8080/videoweb/video/manage.do?method=save&name=xxx&timelength=90& ...
java中的URLEncoder和URLDecoder类.docx
J2ME URLEncoder 和 URLDecoder 类的实现 实现J2ME没有的API
使用URLDecoder和URLEncoder 区别
URLEncoder与URLDecoder的应用 对中文字符进行utf-8编码与解码 希望对各位有用
支持UTF8、16、32编解码。
C++ 版本UrlEncoder编码解码工具:支持ANSIC和UTF8格式,是URLEncoderHTML 格式编码的实用工具类。详情参照文章:...
j2ME URLEncoder Vs URLDEcoder
urlencoder 在Node.js中实现Java Land URLEncoder安装$ npm install urlencoder 例子超级简单: var encoder = require ( 'urlencoder' ) ;encoder . encode ( '哈哈' ) ;执照麻省理工学院
主要介绍了java 使用 URLDecoder 和 URLEncoder 对中文字符进行编码和解码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
主要给大家介绍了关于java中URLEncoder.encode与URLDecoder.decode处理url特殊参数的方法,文中介绍的非常详细,需要的朋友可以参考借鉴,下面来一起看看吧。
语言:English 此扩展可以在浏览器操作中快速执行Urlencode和UrldeCode。 v1.1.0 可选择的编码类型
主要为大家详细介绍了UrlDecoder和UrlEncoder使用方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
直接使用java,当前android中运行python比较麻烦,使用kivy等外部库会导致APP的size非常大,当前没有找到较为完美的解决方案,所以直接java爬虫好了。 形如: String origin = "http://www.baidu.com/s?wd="; ...
安装将urlencoder目录复制到您的system / user / addons文件夹中登录到Expression Engine安装,然后转到Developer-> Add-Ons 安装urlencoder附加组件用法{exp:urlencoder}String you want to encode{/exp:urlencoder...
本文实例讲述了Android编程实现获取新浪天气预报数据的方法。分享给大家供大家参考,具体如下: 新浪天气预报地址: http://php.weather.sina.com.cn/xml.php?city=武汉&password=DJOYnieT8234jlsK&day=0 其中,city...
Android UTF-8转码实例详解 在项目中可能会遇到url中有中文的情况,这个时候我们可能需要对url进行编码 mport java.io.UnsupportedEncodingException; import java.net.URLDecoder; import java.net.URLEncoder; ...
我们需要用UrlEncoder编码为#, %, ', ? 。可以使用以下两种代码,data为string类型的html代码1、webView.loadData(URLEncoder.encode(data, “utf-8”), “text/html”, “utf-8”);这样一些背景效果什么的都不怎么...
主要介绍了java 使用URLDecoder和URLEncoder对中文进行处理的相关资料,需要的朋友可以参考下
本文实例讲述了Android编程向服务器发送请求时出现中文乱码问题的解决方法。分享给大家供大家参考,具体如下: 我们在andorid项目中通过get方式向服务器发送请求,其中url参数带有中文,将会产生乱码,乱码产生的...