linux wget 或curl 能从文件读取吗？

我用wget或者curl 命令获取网页的源代码做了个脚本，然后从源代码里grep及awk要想的数据。一共有70多条网址，这样的话，每执行一次都需要手动更换一下网址。有没有办法，把网址单独放在一个文件中。能直接读取文件，循环到最后一条结束。以下是我的获取网页源代码及处理数据的脚本：
wget "http://xxx.xxxx.com/xxx.html" -O ~/kefu/aqws1/c.txt
l=0

while read line
do
l=`expr $l + 1`
c=$(echo $line | grep "版块主题" | wc -l)
if [ $c != 0 ]; then
echo "find $l"
sed "1,${l}d" ~/kefu/aqws1/c.txt > ~/kefu/aqws1/m.txt
fi
done < ~/kefu/aqws1/c.txt
cat m.txt ||grep -E "<a href=\"home.php\?mod=space&uid=.*c=\"1\">.*</a>"|awk -F '>' '{print $2}'|awk -F '<' '{print $1}' >~/kefu/aqws1/fabiaoren.txt
请教达人指点。或者能一次性把网址都放进去，依次读取处理数据后写入到一个文件中

举报该问题

推荐答案 2013-10-23

wget -i [文件名] -P [保存位置]

文件中，一行一个URL追问

你这样的话，会把所有下载的内容存到文件后再执行脚本中wget下面的 sed 及grep内容。我需要的是读取一个网址后把脚本后面的命令执行完写入到文件，然后再读取第二条网址—处理数据再>>到文件中。

追答

while read line
do
wget $line -O ~/kefu/aqws1/c.txt

#处理获取的网页
#……
#……

done < url_list_file

是这意思吗？

温馨提示：答案为网友推荐，仅供参考

当前网址：http://55.wendadaohang.com/zd/84R8RL4GQ.html

其他回答

第1个回答 2013-10-24

把所有的URL放在一个文件里，每行一个然后做一个循环，每读一行就把他赋给url变量,你再去wget 文件做相应处理即可，

urlfile=/tmp/urls
for url in `cat $urlfile`
do

wget "$url" -O ~/kefu/aqws1/c.txt
l=0

while read line
do
l=`expr $l + 1`
c=$(echo $line | grep "版块主题" | wc -l)
if [ $c != 0 ]; then
echo "find $l"
sed "1,${l}d" ~/kefu/aqws1/c.txt > ~/kefu/aqws1/m.txt
fi
done < ~/kefu/aqws1/c.txt
cat m.txt ||grep -E "<a href=\"home.php\?mod=space&uid=.*c=\"1\">.*</a>"|awk -F '>' '{print $2}'|awk -F '<' '{print $1}' >>~/kefu/aqws1/fabiaoren.txt

done

相似回答

linux wget 或curl 能从文件读取吗?答：wget -i [文件名] -P [保存位置]文件中，一行一个URL

Linux里面wget和curl命令区别是什么?答：《Linux就该这么学》认为：wget命令用来从指定的URL下载文件。wget非常稳定，它在带宽很窄的情况下和不稳定网络中有很强的适应性，如果是由于网络的原因下载失败，wget会不断的尝试，直到整个文件下载完毕。wget支持HTTP，HTTPS和FTP协议，可以使用HTTP代理。所谓的自动下载是指，wget可以在用户退出系统的之后...

使用cURL和wget在Linux上进行HTTP请求和下载答：相比cURL，wget更专注于文件下载，其操作同样简便。在终端中，输入wget <URL>，下载过程即刻启动，进度和文件名会实时显示。当然，wget还提供了更灵活的选项，比如，如果你想将下载的文件存放到特定目录，只需使用-P参数，如：wget -P <directory> <URL>，这样文件就会整齐地落在指定的家园。无论是cUR...

linux wget 命令用法详解答：Linux wget是一个下载文件的工具,它用在命令行下。对于Linux用户是必不可少的工具,尤其对于网络管理员,经常要下载一些软件或从远程服务器恢复备份到本地服务器。如果我们使用虚拟主机,处理这样的事务我们只能先从远程服务器下载到我们电脑磁盘,然后再用ftp工具上传到服务器。这样既浪费时间又浪费精力,那不没办法的事...

curl和wget的区别和用法介绍答：2.curl支持更多的协议。3.curl 默认支持HTTP1.1（也支持1.0），而wget仅仅支持HTTP1.0规范。4.curl在指定要下载的链接时能够支持URL的序列或集合，而wget则不能这样;5.wget支持递归下载，而curl则没有这个功能。Linux curl是一个利用URL规则在命令行下工作的文件传输工具。它支持文件的上传和下载，...