CURL库在C++程序中的运用浅析

不久前出于要做1个爬虫项目,要对众多网址开始展览爬取,所以一向都在看那上头的篇章。在读书了不可计数素材后,下载了3个curl库,着实对项目有了极大的帮助。

一、LibCurl基本编程框架
二、一些基本的函数
三、curl_easy_setopt函数部分选项介绍
四、curl_easy_perform 函数说明(error 状态码)
五、libcurl使用的HTTP消息头
六、获取http应答头信息
七、多线程问题
八、什么时候libcurl无法正常工作
九、关于密码
十、HTTP验证
十一、代码示例
     1.基本的http GET/POST操作
     2 获取html网页
     3 网页下载保存实例
     4 进度条实例显示文件下载进度
     5 断点续传实例

图片 1

 

一、LibCurl基本编程框架
libcurl是一个跨平台的网络协议库,援救http,
https, ftp, gopher, telnet, dict, file, 和ldap
协议。libcurl同样支撑HTTPS证书授权,HTTP POST, HTTP PUT, FTP 上传,
HTTP基本表单上传,代理,cookies,和用户认证。想要知道更加多关于libcurl的介绍,能够到官网 http://curl.haxx.se/上来询问,在那里不再详述。

win3二版的libcurl下载地址:http://curl.freeby.pctools.cl/download/libcurl-7.18.0-win32-msvc.zip

在基于LibCurl的次第里,首要接纳callback function
(回调函数)的款式实现传输任务,用户在开发银行传输前设置好种种参数和回调函数,当满足条件时libcurl将调用用户的回调函数达成特定功效。上面是选取libcurl完毕传输职分的流程:

1.       调用curl_global_init()初始化libcurl
2.       调用curl_easy_init()函数获得 easy interface型指针
3.       调用curl_easy_setopt()安装传输选项
4.      
根据curl_easy_setopt()安装的传输选项,达成回调函数以形成用户特定任务
5.       调用curl_easy_perform()函数达成传输职分
6.       调用curl_easy_cleanup()放出内部存储器
在整过进程中装置curl_easy_setopt()参数是最首要的,大约拥有的libcurl程序都要利用它。

2、一些大旨的函数
1.CURLcode curl_global_init(long flags);
描述:
其1函数只可以用三次。(其实在调用curl_global_cleanup 函数后照旧可再用)
只要那个函数在curl_easy_init函数调用时还没调用,它讲由libcurl库自动调用,据此多线程下最棒积极调用该函数以幸免在线程中curl_easy_init时一再调用。

留神:即便libcurl是线程安全的,但curl_global_init是不能够担保线程安全的,所以不用在种种线程中都调用curl_global_init,应该将该函数的调用放在主线程中。
参数:flags
CURL_GLOBAL_ALL                      //起头化全体的或者的调用。
CURL_GLOBAL_SSL                      //开端化扶助 套套接字层。
CURL_GLOBAL_WIN3贰            //伊始化win3二套接字库。
CURL_GLOBAL_NOTHING         //未有额外的开首化。

2 void curl_global_cleanup(void);
讲述:在截至libcurl使用的时候,用来对curl_global_init做的行事清理。类似于close的函数。

只顾:固然libcurl是线程安全的,但curl_global_cleanup是不可能担保线程安全的,所以不用在每一种线程中都调用curl_global_init,应该将该函数的调用放在主线程中。

3 char *curl_version( );
叙述: 打印当前libcurl库的本子。

4 CURL *curl_easy_init( );
描述:
curl_easy_init用来发轫化一个CU本田UR-VL的指针(有个别像重临FILE类型的指针一样).
相应的在调用结束时要用curl_easy_cleanup函数清理.
一般curl_easy_init意味着3个会话的发轫.
它会回到二个easy_handle(CURL*目的), 1般都用在easy类别的函数中.

5 void curl_easy_cleanup(CURL *handle);
描述:
那几个调用用来终止3个会话.与curl_easy_init同盟着用. 
参数:
CUSportageL类型的指针.

6 CURLcode curl_easy_setopt(CURL *handle, CURLoption option,
parameter);

讲述: 这几个函数最首要了.大约拥有的curl
程序都要再3的应用它.它报告curl库.程序将有如何的行为.
比如要翻开二个网页的html代码等.(那么些函数有个别像ioctl函数)参数:
一 CU本田CR-VL类型的指针
贰 各类CURAV肆Loption类型的选项.(都在curl.hCurry有定义,man 也能够查看到)
3 parameter 那些参数
既能够是个函数的指针,也得以是有些对象的指针,也能够是个long型的变量.它用怎么样那有赖于第三个参数.
CU翼虎Loption 那些参数的取值很多.具体的能够查看man手册.

7 CURLcode curl_easy_perform(CURL *handle);

讲述:那个函数在初步化CUCRUISERL类型的指针 以及curl_easy_setopt完毕后调用.
就如字面包车型地铁意思所说perform就像个舞台.让大家设置的
option 运作起来.参数:
CU揽胜L类型的指针.

三、 curl_easy_setopt函数部分选项介绍
本节主要介绍curl_easy_setopt中跟http相关的参数。该函数是curl中国和欧洲常主要的函数,curl全数安装都是在该函数中完结的,该函数的设置选项众多,注意本节的阐释的只是局地常见选项。

1.     CURLOPT_URL 
设置访问UHavalL

2.       CURLOPT_WRITEFUNCTION,CURLOPT_WRITEDATA
回调函数原型为:size_t function( void *ptr, size_t size, size_t
nmemb, void
*stream); 
函数将在libcurl接收到数码后被调用,因而函数多做多左徒存的效应,如处理下载文件。CU奥德赛LOPT_W奥迪Q伍ITEDATA
用于表明CULX570LOPT_WCR-VITEFUNCTION函数中的stream指针的发源。

借使你未曾经过CU汉兰达LOPT_WCR-VITEFUNCTION属性给easy
handle设置回调函数,libcurl会提供二个暗中同意的回调函数,它只是简短的将收到到的数额打字与印刷到正规输出。你也能够经过
CU帕杰罗LOPT_W索罗德ITEDATA属性给默许回调函数传递2个早就开辟的文书指针,用于将数据输出到文件里。

3.      CURLOPT_HEADERFUNCTION,CURLOPT_HEADERDATA
回调函数原型为 size_t function( void *ptr, size_t size,size_t nmemb,
void *stream); libcurl1旦接受到http
尾部数据后将调用该函数。CUPAJEROLOPT_W奥迪Q7ITEDATA
传递指针给libcurl,该指针注脚CU奇骏LOPT_HEADE奥迪Q叁FUNCTION
函数的stream指针的源于。

4.       CURLOPT_READFUNCTION CURLOPT_READDATA
libCurl要求读取数据传递给长途主机时将调用CULX570LOPT_READFUNCTION钦赐的函数,函数原型是:size_t
function(void *ptr, size_t size, size_t nmemb,void *stream).
CURLOPT_READDATA 表明CURLOPT_READFUNCTION函数原型中的stream指针来源。

5.    
  CURLOPT_NOPROGRESS,CURLOPT_PROGRESSFUNCTION,CURLOPT_PROGRESSDATA
跟数据传输速度相关的参数。CU陆风X八LOPT_PROGRESSFUNCTION
钦赐的函数正常意况下每秒被libcurl调用二次,为了使CULacrosseLOPT_PROGRESSFUNCTION被调用,CURLOPT_NOPROGRESS必须棉被服装置为false,CU卡宴LOPT_PROGRESSDATA钦命的参数将作为CU瑞虎LOPT_PROGRESSFUNCTION钦命函数的首先个参数

6.       CURLOPT_TIMEOUT,CURLOPT_CONNECTIONTIMEOUT:
CURLOPT_TIMEOUT 由于设置传输时间,CU揽胜极光LOPT_CONNECTIONTIMEOUT
设置连接等待时间

  1.       CURLOPT_FOLLOWLOCATION
    设置重定位U卡宴L

8.       CURLOPT_RANGE: CURLOPT_RESUME_FROM:
断点续传相关设置。CU昂CoraLOPT_RANGE 指定char
*参数字传送递给libcurl,用于指明http域的RANGE头域,例如:
表示头500个字节:bytes=0-499
代表第贰个500字节:bytes=500-999
表示最终500个字节:bytes=-500
意味着500字节未来的限制:bytes=500-
先是个和末段1个字节:bytes=0-0,-1
再者钦命多少个范围:bytes=500-600,60一-99玖
CURLOPT_RESUME_FROM
传递一个long参数给libcurl,内定你指望开头传递的 偏移量。

四、 curl_easy_perform 函数表明(error 状态码)
该函数是形成curl_easy_setopt钦赐的拥有选项,本节重点介绍curl_easy_perform的重临值。再次来到0意味1切ok,非0代表错误产生。首要错误码表明:
1.    CURLE_OK 
    义务成功整个都好
2     CURLE_UNSUPPORTED_PROTOCOL
    不援助的协商,由U昂CoraL的头顶内定
3     CURLE_COULDNT_CONNECT
    不能够连续到remote 主机或许代理
4     CURLE_REMOTE_ACCESS_DENIED
    访问被拒绝
5     CURLE_HTTP_RETURNED_ERROR
    Http重临错误
6     CURLE_READ_ERROR
读当半夏件漏洞百出

要获得详细的谬误描述字符串,能够通过const char
*curl_easy_strerror(CURLcode errornum )
 这些函数取得.

 

五、libcurl使用的HTTP消息头
   
当使用libcurl发送http请求时,它会活动抬高1些http头。我们能够透过CU悍马H2LOPT_HTTPHEADE路虎极光属性手动替换、添加或删除相应
的HTTP音讯头。
    Host
    http壹.壹(半数以上http一.0)版本都须要客户端请求提供那一个消息头。
    Pragma
    “no-cache”。表示不要缓冲数据。
    Accept
    “*/*”。表示同意收取任何类型的数目。
    Expect
   
以POST的措施向HTTP服务器交由请求时,libcurl会设置该新闻头为”十0-continue”,它需要服务器在正规处理该请求从前,重临3个”OK”音讯。借使POST的数码非常小,libcurl恐怕不会设置该新闻头。
自定义选项
   
当前更是多的协商都塑造在HTTP协议之上(如:soap),这根本归功于HTTP的可信赖性,以及被普遍利用的代办帮助(能够穿透大多数防火墙)。
那个协议的利用办法与守旧HTTP恐怕有非常大的例外。对此,libcurl作了很好的支持。
    自定义请求情势(CustomRequest)
    HTTP帮忙GET,
HEAD只怕POST提交请求。能够设置CU昂科拉LOPT_CUSTOMREQUEST来设置自定义的请求格局,libcurl暗许以GET形式提交请求:
    curl_easy_setopt(easy_handle, CURLOPT_CUSTOMREQUEST,
“MYOWNREQUEST”); 

修改消息头
   
HTTP协议提供了新闻头,请求音讯头用于告诉服务器如何处理请求;响应新闻头则告知浏览器怎么着处理接收到的数据。在libcurl中,你能够随心所欲的添加
那几个音信头:

图片 2

struct curl_slist *headers=NULL; /* init to NULL is important */
headers = curl_slist_append(headers, "Hey-server-hey: how are you?");
headers = curl_slist_append(headers, "X-silly-content: yes");
/* pass our list of custom made headers */
curl_easy_setopt(easyhandle, CURLOPT_HTTPHEADER, headers);
curl_easy_perform(easyhandle); /* transfer http */
curl_slist_free_all(headers); /* free the header list */

图片 3

对于曾经存在的新闻头,能够另行设置它的值:

headers = curl_slist_append(headers, "Accept: Agent-007"); 
headers = curl_slist_append(headers, "Host: munged.host.line"); 

删除音信头
对此三个早就存在的音信头,设置它的始末为空,libcurl在发送请求时就不会同时提交该音讯头:

headers = curl_slist_append(headers, "Accept:");

 

六、获取http应答头消息

   
发出http请求后,服务器会回来应答头音信和答复数据,假设单纯是打字与印刷应答头的全部内容,则向来能够因而curl_easy_setopt(curl,
CURLOPT_HEADECRUISERFUNCTION,
打字与印刷函数)的办法来成功,那里要求获得的是应答头中一定的消息,比如应答码、cookies列表等,则须要通过下边那些函数:
    CURLcode curl_easy_getinfo(CURL *curl, CURLINFO info, …
); 

    info参数正是我们供给获得的内容,上边是局部参数值:
    1.CURLINFO_RESPONSE_CODE
    获取应答码
    2.CURLINFO_HEADER_SIZE
    头大小
    3.CURLINFO_COOKIELIST
    cookies列表

   
除了得到应答信息外,那几个函数还是能够获取curl的一部分里面音信,如请求时间、连接时间等等。

    越来越多的参数能够参考API文书档案。

 

七、二十八线程难点
    首先三个为主尺度正是:相对不该在线程之间共享同二个libcurl
handle(CUXC60L *目的),不管是easy handle依旧multi
handle(本文只介绍easy_handle)。1个线程每一遍只好动用四个handle。
    libcurl是线程安全的,但有两点差异:确定性信号(signals)和SSL/TLS handler。
实信号用于超时失效名字解析(timing out name
resolves)。libcurl注重别的的库来帮忙SSL/STL,所以用八线程的措施访问HTTPS或FTPS的UENVISIONL时,应该满意这么些库对拾2线程操作的一对供给。详细能够参考:
   
OpenSSL: http://www.openssl.org/docs/crypto/threads.html#DESCRIPTION

   
GnuTLS: http://www.gnu.org/software/gnutls/manual/html_node/Multi_002dthreaded-applications.html

    NSS: 宣称是102线程安全的。

八、曾几何时libcurl不或者平常工作
   
传输战败总是有来头的。你恐怕错误的设置了部分libcurl的习性或许未有正确的了然1些质量的意思,大概是长途主机再次回到一些无法被正确解析的内容。
   
那里有贰个黄金法则来处理那么些标题:将CULacrosseLOPT_VE翼虎1MORE属性设置为壹,libcurl会输出通讯进程中的一些细节。假设使用的是http协
议,请求头/响应头也会被输出。将CULX570LOPT_HEADE本田CR-V设为一,那一个头新闻将现出在消息的内容中。
    当然不可不可以认的是,libcurl还存在bug。
    若是您对有关的协商领悟更多,在运用libcurl时,就越不简单犯错。

九、关于密码
   
客户端向服务器发送请求时,许多共谋都务求提供用户名与密码。libcurl提供了七种主意来安装它们。
    一些协议帮助在U奇骏L中向来钦定用户名和密码,类似于:
protocol://user:password@example.com/path/。libcurl能科学的鉴定识别那种U逍客L中的用户名与密码并施行
相应的操作。假使你提供的用户名和密码中有特殊字符,首先应当对其开始展览U汉兰达L编码。
    也能够经过CU奥德赛LOPT_USE锐界PWD属性来安装用户名与密码。参数是格式如
“user:password ”的字符串:
    curl_easy_setopt(easy_handle, CURLOPT_USERPWD,
“user_name:password”)

   
有时候在做客代理服务器的时候,恐怕每三三十日必要提供用户名和密码举行用户身份验证。那种情形下,libcurl提供了另
3天性能CUPAJEROLOPT_PROXYUSERPWD:
    curl_easy_setopt(easy_handle, CURLOPT_PROXYUSERPWD,
“user_name:password”);
 
   
在UNIX平台下,访问FTP的用户名和密码大概会被保存在$HOME/.netrc文件中。libcurl扶助直接从这几个文件中收获用户名与密码:
    curl_easy_setopt(easy_handle, CURLOPT_NETRC, 1L); 
   
在行使SSL时,大概需求提供一个私钥用于数据安全传输,通过CUENVISIONLOPT_KEYPASSWD来设置私钥:
    curl_easy_setopt(easy_handle, CURLOPT_KEYPASSWD,
“keypassword”);

十、HTTP验证
    在动用HTTP协议时,客户端有很各样措施向服务器提供验证消息。暗中认可的
HTTP验证方法是”Basic”,它将用户名与密码以公开的法子、经Base6四编码后保存在HTTP请求头中,发往服务器。当然这不太安全。
    当前版本的libcurl援助的证实格局有:basic, Digest, NTLM, Negotiate,
GSS-Negotiate and
SPNEGO。(译者惊叹:搞Web这么长年累月,尽然不知底那么些Http的表明格局,实在惭愧。)能够经过CUEscortLOPT_HTTPAUTH属性来设置具体
的证实办法:
    curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH,
CURLAUTH_DIGEST);

   
向代理服务器发送验证消息时,能够经过CUPRADOLOPT_PROXYAUTH设置验证办法:
    curl_easy_setopt(easy_handle, CURLOPT_PROXYAUTH,
CURLAUTH_NTLM);

    也能够而且安装各类表达措施(通过按位与),
使用‘CUTucsonLAUTH_ANY‘将允许libcurl能够选择任何它所支撑的认证办法。通过CU奥迪Q五LOPT_HTTPAUTH或
CURLOPT_PROXYAUTH属性设置的两种验证办法,libcurl会在运行时精选1种它认为是最棒的点子与服务器通讯:
    curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH,
CURLAUTH_DIGEST|CURLAUTH_BASIC); 

    // curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH,
CURLAUTH_ANY);

 

十一、代码示例

下载的libcurl中自带了好多演示代码,在docs\examples目录下,建议下载该库后能够读书一下这一个代码。

libcurl的API文档在docs\libcurl\index.html中。

1.基本的http GET/POST操作

图片 4

#include <stdio.h>
#include <curl/curl.h>
bool getUrl(char *filename)
{
    CURL *curl;
    CURLcode res;
    FILE *fp;
    if ((fp = fopen(filename, "w")) == NULL)  // 返回结果用文件存储
        return false;
    struct curl_slist *headers = NULL;
    headers = curl_slist_append(headers, "Accept: Agent-007");
    curl = curl_easy_init();    // 初始化
    if (curl)
    {
        //curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");// 代理
        curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);// 改协议头
        curl_easy_setopt(curl, CURLOPT_URL,"http://www.baidu.com");
        curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp); //将返回的http头输出到fp指向的文件
        curl_easy_setopt(curl, CURLOPT_HEADERDATA, fp); //将返回的html主体数据输出到fp指向的文件
        res = curl_easy_perform(curl);   // 执行
        if (res != 0) {

            curl_slist_free_all(headers);
            curl_easy_cleanup(curl);
        }
        fclose(fp);
        return true;
    }
}
bool postUrl(char *filename)
{
    CURL *curl;
    CURLcode res;
    FILE *fp;
    if ((fp = fopen(filename, "w")) == NULL)
        return false;
    curl = curl_easy_init();
    if (curl)
    {
        curl_easy_setopt(curl, CURLOPT_COOKIEFILE, "/tmp/cookie.txt"); // 指定cookie文件
        curl_easy_setopt(curl, CURLOPT_POSTFIELDS, "&logintype=uid&u=xieyan&psw=xxx86");    // 指定post内容
        //curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");
        curl_easy_setopt(curl, CURLOPT_URL, " http://mail.sina.com.cn/cgi-bin/login.cgi ");   // 指定url
        curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);
        res = curl_easy_perform(curl);
        curl_easy_cleanup(curl);
    }
    fclose(fp);
    return true;
}
int main(void)
{
    getUrl("/tmp/get.html");
    postUrl("/tmp/post.html");
}

图片 5

编译gcc  get_post.c  -o get_post –lcurl

./ get_post

2 获取html网页

图片 6

#include <stdio.h>
#include <curl/curl.h>
#include <stdlib.h>
int main(int argc, char *argv[])
{
    CURL *curl;             //定义CURL类型的指针
CURLcode res;           //定义CURLcode类型的变量,保存返回状态码
    if(argc!=2)
    {
        printf("Usage : file <url>;\n");
        exit(1);
    }

    curl = curl_easy_init();        //初始化一个CURL类型的指针
    if(curl!=NULL)
    {
        //设置curl选项. 其中CURLOPT_URL是让用户指 定url. argv[1]中存放的命令行传进来的网址
        curl_easy_setopt(curl, CURLOPT_URL, argv[1]);        
        //调用curl_easy_perform 执行我们的设置.并进行相关的操作. 在这 里只在屏幕上显示出来.
        res = curl_easy_perform(curl);
        //清除curl操作.
        curl_easy_cleanup(curl);
    }
    return 0;
}

图片 7

编译gcc  get_http.c  -o get_http –lcurl

./ get_http www.baidu.com

 

3 网页下载保存实例

图片 8

// 采用CURLOPT_WRITEFUNCTION 实现网页下载保存功能
#include <stdio.h>;
#include <stdlib.h>;
#include <unistd.h>;

#include <curl/curl.h>;
#include <curl/types.h>;
#include <curl/easy.h>;

FILE *fp;  //定义FILE类型指针
//这个函数是为了符合CURLOPT_WRITEFUNCTION而构造的
//完成数据保存功能
size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream)  
{
    int written = fwrite(ptr, size, nmemb, (FILE *)fp);
    return written;
}

int main(int argc, char *argv[])
{
    CURL *curl;

    curl_global_init(CURL_GLOBAL_ALL);  
    curl=curl_easy_init();
    curl_easy_setopt(curl, CURLOPT_URL, argv[1]);  

    if((fp=fopen(argv[2],"w"))==NULL)
    {
        curl_easy_cleanup(curl);
        exit(1);
    }
////CURLOPT_WRITEFUNCTION 将后继的动作交给write_data函数处理
    curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data);  
    curl_easy_perform(curl);
    curl_easy_cleanup(curl);
    exit(0);
}

图片 9

编译gcc  save_http.c  -o save_http –lcurl
./ save_http www.baidu.com
  /tmp/baidu

4 进程条实例呈现文件下载进程

图片 10

// 采用CURLOPT_NOPROGRESS, CURLOPT_PROGRESSFUNCTION    CURLOPT_PROGRESSDATA 实现文件传输进度提示功能
//函数采用了gtk库,故编译时需指定gtk库
//函数启动专门的线程用于显示gtk 进度条bar
#include <stdio.h>
#include <gtk/gtk.h>
#include <curl/curl.h>
#include <curl/types.h> /* new for v7 */
#include <curl/easy.h> /* new for v7 */

GtkWidget *Bar;
////这个函数是为了符合CURLOPT_WRITEFUNCTION而构造的
//完成数据保存功能
size_t my_write_func(void *ptr, size_t size, size_t nmemb, FILE *stream)
{
  return fwrite(ptr, size, nmemb, stream);
}
//这个函数是为了符合CURLOPT_READFUNCTION而构造的
//数据上传时使用
size_t my_read_func(void *ptr, size_t size, size_t nmemb, FILE *stream)
{
  return fread(ptr, size, nmemb, stream);
}
//这个函数是为了符合CURLOPT_PROGRESSFUNCTION而构造的
//显示文件传输进度,t代表文件大小,d代表传 输已经完成部分
int my_progress_func(GtkWidget *bar,
                     double t, /* dltotal */
                     double d, /* dlnow */
                     double ultotal,
                     double ulnow)
{
/*  printf("%d / %d (%g %%)\n", d, t, d*100.0/t);*/
  gdk_threads_enter();
  gtk_progress_set_value(GTK_PROGRESS(bar), d*100.0/t);
  gdk_threads_leave();
  return 0;
}

void *my_thread(void *ptr)
{
  CURL *curl;
  CURLcode res;
  FILE *outfile;
  gchar *url = ptr;

  curl = curl_easy_init();
  if(curl)
  {
    outfile = fopen("test.curl", "w");

    curl_easy_setopt(curl, CURLOPT_URL, url);
    curl_easy_setopt(curl, CURLOPT_WRITEDATA, outfile);
    curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, my_write_func);
    curl_easy_setopt(curl, CURLOPT_READFUNCTION, my_read_func);
    curl_easy_setopt(curl, CURLOPT_NOPROGRESS, 0L);
    curl_easy_setopt(curl, CURLOPT_PROGRESSFUNCTION, my_progress_func);
    curl_easy_setopt(curl, CURLOPT_PROGRESSDATA, Bar);

    res = curl_easy_perform(curl);

    fclose(outfile);
    /* always cleanup */
    curl_easy_cleanup(curl);
  }

  return NULL;
}

int main(int argc, char **argv)
{
  GtkWidget *Window, *Frame, *Frame2;
  GtkAdjustment *adj;

  /* Must initialize libcurl before any threads are started */
  curl_global_init(CURL_GLOBAL_ALL);

  /* Init thread */
  g_thread_init(NULL);

  gtk_init(&argc, &argv);
  Window = gtk_window_new(GTK_WINDOW_TOPLEVEL);
  Frame = gtk_frame_new(NULL);
  gtk_frame_set_shadow_type(GTK_FRAME(Frame), GTK_SHADOW_OUT);
  gtk_container_add(GTK_CONTAINER(Window), Frame);
  Frame2 = gtk_frame_new(NULL);
  gtk_frame_set_shadow_type(GTK_FRAME(Frame2), GTK_SHADOW_IN);
  gtk_container_add(GTK_CONTAINER(Frame), Frame2);
  gtk_container_set_border_width(GTK_CONTAINER(Frame2), 5);
  adj = (GtkAdjustment*)gtk_adjustment_new(0, 0, 100, 0, 0, 0);
  Bar = gtk_progress_bar_new_with_adjustment(adj);
  gtk_container_add(GTK_CONTAINER(Frame2), Bar);
  gtk_widget_show_all(Window);

  if (!g_thread_create(&my_thread, argv[1], FALSE, NULL) != 0)
    g_warning("can't create the thread");


  gdk_threads_enter();
  gtk_main();
  gdk_threads_leave();
  return 0;
}

图片 11

编译export PKG_CONFIG_PATH=/usr/lib/pkgconfig/
gcc progress.c –o progress ` pkg-config –libs –cflags gtk+-2..0`
-lcurl –lgthread-2.0
./ progress  http://software.sky-union.cn/index.asp

5 断点续传实例

图片 12

//采用CURLOPT_RESUME_FROM_LARGE 实现文件断点续传功能
#include <stdlib.h>
#include <stdio.h>
#include <sys/stat.h>

#include <curl/curl.h>
//这个函数为CURLOPT_HEADERFUNCTION参数构造
/* 从http头部获取文件size*/
size_t getcontentlengthfunc(void *ptr, size_t size, size_t nmemb, void *stream) {
       int r;
       long len = 0;

       /* _snscanf() is Win32 specific */
       // r = _snscanf(ptr, size * nmemb, "Content-Length: %ld\n", &len);
 r = sscanf(ptr, "Content-Length: %ld\n", &len);
       if (r) /* Microsoft: we don't read the specs */
              *((long *) stream) = len;

       return size * nmemb;
}

/* 保存下载文件 */
size_t wirtefunc(void *ptr, size_t size, size_t nmemb, void *stream)
{
        return fwrite(ptr, size, nmemb, stream);
}

/*读取上传文件 */
size_t readfunc(void *ptr, size_t size, size_t nmemb, void *stream)
{
       FILE *f = stream;
       size_t n;

       if (ferror(f))
              return CURL_READFUNC_ABORT;

       n = fread(ptr, size, nmemb, f) * size;

       return n;
}

// 下载 或者上传文件函数
int download(CURL *curlhandle, const char * remotepath, const char * localpath,
           long timeout, long tries)
{
       FILE *f;
       curl_off_t local_file_len = -1 ;
       long filesize =0 ;

       CURLcode r = CURLE_GOT_NOTHING;
       int c;
  struct stat file_info;
  int use_resume = 0;
  /* 得到本地文件大小 */
  //if(access(localpath,F_OK) ==0)

    if(stat(localpath, &file_info) == 0) 
     {
        local_file_len =  file_info.st_size;
        use_resume  = 1;
      }
  //采用追加方式打开文件,便于实现文件断点续传工作
       f = fopen(localpath, "ab+"); 
       if (f == NULL) {
              perror(NULL);
              return 0;
       }

       //curl_easy_setopt(curlhandle, CURLOPT_UPLOAD, 1L);

       curl_easy_setopt(curlhandle, CURLOPT_URL, remotepath);

              curl_easy_setopt(curlhandle, CURLOPT_CONNECTTIMEOUT, timeout);  // 设置连接超时,单位秒
       //设置http 头部处理函数
       curl_easy_setopt(curlhandle, CURLOPT_HEADERFUNCTION, getcontentlengthfunc);
       curl_easy_setopt(curlhandle, CURLOPT_HEADERDATA, &filesize);
 // 设置文件续传的位置给libcurl
       curl_easy_setopt(curlhandle, CURLOPT_RESUME_FROM_LARGE, use_resume?local_file_len:0);

       curl_easy_setopt(curlhandle, CURLOPT_WRITEDATA, f);
       curl_easy_setopt(curlhandle, CURLOPT_WRITEFUNCTION, wirtefunc);

       //curl_easy_setopt(curlhandle, CURLOPT_READFUNCTION, readfunc);
       //curl_easy_setopt(curlhandle, CURLOPT_READDATA, f);
       curl_easy_setopt(curlhandle, CURLOPT_NOPROGRESS, 1L);
       curl_easy_setopt(curlhandle, CURLOPT_VERBOSE, 1L);


  r = curl_easy_perform(curlhandle);


       fclose(f);

       if (r == CURLE_OK)
              return 1;
       else {
              fprintf(stderr, "%s\n", curl_easy_strerror(r));
              return 0;
       }
}

int main(int c, char **argv) {
       CURL *curlhandle = NULL;

       curl_global_init(CURL_GLOBAL_ALL);
       curlhandle = curl_easy_init();

       //download(curlhandle, "ftp://user:pass@host/path/file", "C:\\file", 0, 3);
  download(curlhandle , "http://software.sky-union.cn/index.asp","/work/index.asp",1,3);
       curl_easy_cleanup(curlhandle);
       curl_global_cleanup();

       return 0;
}

图片 13

编译gcc  resume.c  -o resume –lcurl
./ resume  

如上转自:http://www.cnblogs.com/moodlxs/archive/2012/10/15/2724318.html

 

本身的类别的代码:

int  Query(char *Url)
 {

    ContentPage.Init();
    CURL *curl;
    char curl_errbuf[CURL_ERROR_SIZE];
    curl = curl_easy_init();
    curl_easy_setopt(curl, CURLOPT_URL, Url);
    curl_easy_setopt(curl, CURLOPT_ERRORBUFFER, curl_errbuf);
    curl_easy_setopt(curl, CURLOPT_NOPROGRESS, 0L);
    curl_easy_setopt(curl, CURLOPT_VERBOSE, 1L);
    curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, PraseHtml::CurlBodyProc);
    curl_easy_setopt(curl, CURLOPT_WRITEDATA, &ContentPage);
    int err=curl_easy_perform(curl);
    curl_easy_cleanup(curl);

    return err;
 }

转发请注明出处:http://www.cnblogs.com/fnlingnzb-learner/p/5835411.html

相关文章