: | : | :期货程序化 | :期货程序化研究 | :期货量化学习 | :期货量化 |
返回列表 发帖

新浪正规则space.php

新浪正规则space.php

  1. $regex_link = '#(?<=<li><a href=").+?(?=")#s'; //问题在这里。$regex_tit = '#(?<=<title>)(.+?)(?=</title>)#s';$regex_con = "#(?<=f_id='45' -->)(.*?)(?=<!-- news_keyword_pub)#s";
复制代码

这个是源地址:http://roll.finance.sina.com.cn/finance/qh/pzyj/index.shtml

这是问题链接,问题就出在提取这个链接时出现了,因为没有特别的代码,所以提取了一些不是这个需要的链接。
  1. <ul class="list_009">                        
  2.                                 <li><a href="http://finance.sina.com.cn/money/future/rese/2017-07-12/doc-ifyhweua4871165.shtml" target="_blank">现货“挺价潮”染红螺纹期盘 未来有望延续上涨</a><span>(07月12日 00:57)</span></li>
  3.                                        
  4.                                        
  5.                                 <li><a href="http://finance.sina.com.cn/money/future/indu/2017-07-11/doc-ifyhweua4814030.shtml" target="_blank">瑞达期货:双焦延续涨势 多头策略为主</a><span>(07月11日 16:54)</span></li>
  6.                                        
  7.                                        
  8.                                 <li><a href="http://finance.sina.com.cn/money/future/indu/2017-07-11/doc-ifyhweua4811854.shtml" target="_blank">瑞达期货:沥青量能俱增 期价收涨</a><span>(07月11日 16:39)</span></li>
  9.                                        
  10.                                        
  11.                                 <li><a href="http://finance.sina.com.cn/money/future/indu/2017-07-11/doc-ifyhweua4809298.shtml" target="_blank">瑞达期货:郑煤振荡冲高 多头情绪笼罩</a><span>(07月11日 16:25)</span></li>
  12.                                        
  13.                                        
  14.                                 <li><a href="http://finance.sina.com.cn/money/future/indu/2017-07-11/doc-ifyhweua4804061.shtml" target="_blank">瑞达期货:甲醇增仓增量 期价收涨</a><span>(07月11日 15:54)</span></li>
  15.                                        
  16.                 </ul>
复制代码


这是部分出错的链接
  1. <span id="bloglist" class="bloglist" style="position:relative"><a style="position:relative;" id="bloglist" class="bloglist" href="http://blog.sina.com.cn/lm/finance/">博客</a><span class="blog_list" id="blog_list"><ul><li><a href="http://blog.sina.com.cn/lm/finance/" target="_blank">财经博客</a></li><li><a href="http://blog.sina.com.cn/lm/stock/" target="_blank">股票博客</a></li></ul></span></span>        
复制代码



我想用<li><a href="  和 “来截取链接。但是出现了在非想要的链接。这样的情况下只能多加些标志源码。比方说 将上个链接的部分源码 </span></li><li><a href=">来做为截取链接的前面的代码。但是在源码中这一串源码中间不仅有空格还有换行。用这个正规则我测试了一下是取不出地址的。说是语法错误。

论坛官方微信、群(期货热点、量化探讨、开户与绑定实盘)
 
期货论坛 - 版权/免责声明   1.本站发布源码(包括函数、指标、策略等)均属开放源码,用意在于让使用者学习程序化语法撰写,使用者可以任意修改语法內容并调整参数。仅限用于个人学习使用,请勿转载、滥用,严禁私自连接实盘账户交易
  2.本站发布资讯(包括文章、视频、历史记录、教材、评论、资讯、交易方案等)均系转载自网络主流媒体,内容仅为作者当日个人观点,本网转载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。本网不对该类信息或数据做任何保证。不对您构成任何投资建议,不能依靠信息而取代自身独立判断,不对因使用本篇文章所诉信息或观点等导致的损失承担任何责任。
  3.本站发布资源(包括书籍、杂志、文档、软件等)均从互联网搜索而来,仅供个人免费交流学习,不可用作商业用途,本站不对显示的内容承担任何责任。请在下载后24小时内删除。如果喜欢,请购买正版,谢谢合作!
  4.龙听期货论坛原创文章属本网版权作品,转载须注明来源“龙听期货论坛”,违者本网将保留追究其相关法律责任的权力。本论坛除发布原创文章外,亦致力于优秀财经文章的交流分享,部分文章推送时若未能及时与原作者取得联系并涉及版权问题时,请及时联系删除。联系方式:http://www.qhlt.cn/thread-262-1-1.html
如何访问权限为100/255贴子:/thread-37840-1-1.html;注册后仍无法回复:/thread-23-1-1.html;微信/QQ群:/thread-262-1-1.html;网盘链接失效解决办法:/thread-93307-1-1.html

我做的几个RSS,不知道为什么在昨天您发的那个网站上时显示超时,没有一个能成功更新的。


如何访问权限为100/255贴子:/thread-37840-1-1.html;注册后仍无法回复:/thread-23-1-1.html;微信/QQ群:/thread-262-1-1.html;网盘链接失效解决办法:/thread-93307-1-1.html

TOP

返回列表