ACCESSCURL库以C++程序中之采取浅析

近年出于要开一个爬虫项目,要对准过剩网站开展爬取,所以直接还在扣押这上头的章。在看了许多材料后,下载了一个curl库,着实对品种来矣挺挺之赞助。

一、LibCurl基本编程框架
二、一些基本的函数
三、curl_easy_setopt函数部分选项介绍
四、curl_easy_perform 函数说明(error 状态码)
五、libcurl使用的HTTP消息头
六、获取http应答头信息
七、多线程问题
八、什么时候libcurl无法正常工作
九、关于密码
十、HTTP验证
十一、代码示例
     1.基本的http GET/POST操作
     2 获取html网页
     3 网页下载保存实例
     4 进度条实例显示文件下载进度
     5 断点续传实例

ACCESS 1

 

同一、LibCurl基本编程框架
libcurl大凡一个跨平台的网络协议库,支持http,
https, ftp, gopher, telnet, dict, file, 和ldap
协议。libcurl同样支持HTTPS证书授权,HTTP POST, HTTP PUT, FTP 上污染,
HTTP基本表单上传,代理,cookies,和用户征。想要知再也多关于libcurl的介绍,可以到集体网 http://curl.haxx.se/上询问,在此不再详述。

win32本子的libcurl下充斥地址:http://curl.freeby.pctools.cl/download/libcurl-7.18.0-win32-msvc.zip

在基于LibCurl的顺序里,主要用callback function
(回调函数)的形式好传输任务,用户在开行传输前设置好个参数与回调函数,当满足条件时libcurl将调用用户之回调函数实现特定功能。下面是采取libcurl完成传输任务之流程:

1.       调用curl_global_init()初始化libcurl
2.       调用curl_easy_init()函数得到 easy interface型指针
3.       调用curl_easy_setopt()安装导选项
4.      
根据curl_easy_setopt()设置的导选项,实现回调函数以好用户特定任务
5.       调用curl_easy_perform()函数完成传输任务
6.       调用curl_easy_cleanup()放出内存
以整过过程被设置curl_easy_setopt()参数是无与伦比要的,几乎所有的libcurl程序都要动她。

其次、一些主导的函数
1.CURLcode curl_global_init(long flags);
描述:
此函数只能用相同不好。(其实在调用curl_global_cleanup 函数后依旧可更用)
假若此函数在curl_easy_init函数调用时还不曾调用,它说由libcurl库自动调用,故多线程下最为好积极调用该函数以防止在线程中curl_easy_init时反复调用。

留神:虽然libcurl是线程安全之,但curl_global_init是不克确保线程安全之,所以并非以每个线程中还调用curl_global_init,应该将该函数的调用放在主线程中。
参数:flags
CURL_GLOBAL_ALL                      //初始化所有的或是的调用。
CURL_GLOBAL_SSL                      //初始化支持 安全宪章接字层。
CURL_GLOBAL_WIN32            //初始化win32模拟接字库。
CURL_GLOBAL_NOTHING         //没有额外的初始化。

2 void curl_global_cleanup(void);
叙述:在终止libcurl使用的时光,用来针对curl_global_init做的办事清理。类似于close的函数。

留神:虽然libcurl是线程安全之,但curl_global_cleanup是休克管线程安全之,所以不要以每个线程中还调用curl_global_init,应该用欠函数的调用放在主线程中。

3 char *curl_version( );
叙: 打印当前libcurl库的版本。

4 CURL *curl_easy_init( );
描述:
curl_easy_init用来初始化一个CURL的指针(有些像返回FILE类型的指针一样).
相应的以调用了时如果因此curl_easy_cleanup函数清理.
一般curl_easy_init意味着一个对话的开始.
它见面回去一个easy_handle(CURL*目标), 一般都用在easy系列的函数中.

5 void curl_easy_cleanup(CURL *handle);
描述:
斯调用用来终结一个碰头话.与curl_easy_init配合着用. 
参数:
CURL类型的指针.

6 CURLcode curl_easy_setopt(CURL *handle, CURLoption option,
parameter);

讲述: 这个函数最紧要了.几乎所有的curl
程序都使累之动它.它告诉curl库.程序用发出哪些的行为.
比如使翻看一个网页的html代码等.(这个函数有些像ioctl函数)参数:
1 CURL类型的指针
2 各种CURLoption类型的精选项.(都于curl.h库里发出定义,man 也堪查相)
3 parameter 这个参数
既好是只函数的指针,也足以是某某对象的指针,也得是单long型的变量.它用什么就有赖于第二只参数.
CURLoption 这个参数的取值很多.具体的好翻man手册.

7 CURLcode curl_easy_perform(CURL *handle);

叙:这个函数在初始化CURL类型的指针 以及curl_easy_setopt完成后调整用.
就像字面的意所说perform就比如是只舞台.让咱安的
option 运作起来.参数:
CURL类型的指针.

三、 curl_easy_setopt函数部分选项介绍
本节紧要介绍curl_easy_setopt中及http相关的参数。该函数是curl中甚重要的函数,curl所有安装都是于该函数着就的,该函数的安选项多,注意本节的论述的单纯是局部大选项。

1.     CURLOPT_URL 
设置访问URL

2.       CURLOPT_WRITEFUNCTION,CURLOPT_WRITEDATA
转头调函数原型为:size_t function( void *ptr, size_t size, size_t
nmemb, void
*stream); 
函数将在libcurl接收至数量后被调用,因此函数多做多少保存的机能,如处理下载文件。CURLOPT_WRITEDATA
用于表明CURLOPT_WRITEFUNCTION函数中之stream指针的根源。

要你莫经过CURLOPT_WRITEFUNCTION属性给easy
handle设置回调函数,libcurl会提供一个默认的回调函数,它只是略的将收到到之数码打印至正规输出。你为堪经过
CURLOPT_WRITEDATA属性给默认回调函数传递一个早已打开的公文指针,用于将数据输出到文件里。

3.      CURLOPT_HEADERFUNCTION,CURLOPT_HEADERDATA
扭转调函数原型为 size_t function( void *ptr, size_t size,size_t nmemb,
void *stream); libcurl一旦接到及http
头部数后以调用该函数。CURLOPT_WRITEDATA
传递指针给libcurl,该指针表明CURLOPT_HEADERFUNCTION
函数的stream指针的来源。

4.       CURLOPT_READFUNCTION CURLOPT_READDATA
libCurl需要读取数据传递让长途主机时用调用CURLOPT_READFUNCTION指定的函数,函数原型是:size_t
function(void *ptr, size_t size, size_t nmemb,void *stream).
CURLOPT_READDATA 表明CURLOPT_READFUNCTION函数原型中之stream指针来源。

5.    
  CURLOPT_NOPROGRESS,CURLOPT_PROGRESSFUNCTION,CURLOPT_PROGRESSDATA
以及数据传速度相关的参数。CURLOPT_PROGRESSFUNCTION
指定的函数正常状态下各秒为libcurl调用相同涂鸦,为了使CURLOPT_PROGRESSFUNCTION被调用,CURLOPT_NOPROGRESS必须于设置为false,CURLOPT_PROGRESSDATA指定的参数将作为CURLOPT_PROGRESSFUNCTION指定函数的第一只参数

6.       CURLOPT_TIMEOUT,CURLOPT_CONNECTIONTIMEOUT:
CURLOPT_TIMEOUT 由于设置导时间,CURLOPT_CONNECTIONTIMEOUT
设置连接等时

  1.       CURLOPT_FOLLOWLOCATION
    安装重定位URL

8.       CURLOPT_RANGE: CURLOPT_RESUME_FROM:
断点续传相关设置。CURLOPT_RANGE 指定char
*参数传递给libcurl,用于指明http域的RANGE头域,例如:
表示头500个字节:bytes=0-499
表示第二单500字节:bytes=500-999
代表最终500只字节:bytes=-500
意味着500字节以后的限:bytes=500-
首先单同终极一个字节:bytes=0-0,-1
而指定几独限:bytes=500-600,601-999
CURLOPT_RESUME_FROM
传递一个long参数为libcurl,指定你盼开传递的 偏移量。

四、 curl_easy_perform 函数说明(error 状态码)
拖欠函数是做到curl_easy_setopt指定的富有选项,本节重点介绍curl_easy_perform的返值。返回0意味一切ok,非0代表错误产生。主要错误码说明:
1.    CURLE_OK 
    任务成功全套都吓
2     CURLE_UNSUPPORTED_PROTOCOL
    不支持之磋商,由URL的头颅指定
3     CURLE_COULDNT_CONNECT
    不能够连续至remote 主机或者代理
4     CURLE_REMOTE_ACCESS_DENIED
    访问于驳回
5     CURLE_HTTP_RETURNED_ERROR
    Http返回错误
6     CURLE_READ_ERROR
诵读本地文件漏洞百出

如若得到详细的一无是处描述字符串,可以透过const char
*curl_easy_strerror(CURLcode errornum )
 这个函数取得.

 

五、libcurl使用的HTTP消息头
   
当以libcurl发送http请求时,它见面自动抬高一些http头。我们好透过CURLOPT_HTTPHEADER属性手动替换、添加或删除相应
的HTTP消息头。
    Host
    http1.1(大部分http1.0)版本都务求客户端请求提供者信息头。
    Pragma
    “no-cache”。表示并非缓冲数据。
    Accept
    “*/*”。表示同意收取任何类型的数目。
    Expect
   
以POST的法为HTTP服务器交由请求时,libcurl会设置该消息头为”100-continue”,它要求服务器在标准拍卖该要之前,返回一
个”OK”消息。如果POST的数目好有些,libcurl可能未会见装该消息头。
打定义选项
   
当前越来越多的商议还构建以HTTP协议之上(如:soap),这重要归功给HTTP的可靠性,以及吃广泛应用的代办支持(可以穿透大部分防火墙)。
这些协议的以方法跟习俗HTTP可能出十分十分的不等。对这,libcurl作了挺好的支持。
    自定义请求方式(CustomRequest)
    HTTP支持GET,
HEAD或者POST提交请求。可以安装CURLOPT_CUSTOMREQUEST来安装由定义之求方式,libcurl默认以GET方式提交请求:
    curl_easy_setopt(easy_handle, CURLOPT_CUSTOMREQUEST,
“MYOWNREQUEST”); 

修改消息头
   
HTTP协议提供了消息头,请求消息头用于告诉服务器如何处理要;响应消息头则告知浏览器如何处理接收到的数额。在libcurl中,你得肆意之添加
这些消息头:

ACCESS 2

struct curl_slist *headers=NULL; /* init to NULL is important */
headers = curl_slist_append(headers, "Hey-server-hey: how are you?");
headers = curl_slist_append(headers, "X-silly-content: yes");
/* pass our list of custom made headers */
curl_easy_setopt(easyhandle, CURLOPT_HTTPHEADER, headers);
curl_easy_perform(easyhandle); /* transfer http */
curl_slist_free_all(headers); /* free the header list */

ACCESS 3

对此已是的消息头,可以还设置它的值:

headers = curl_slist_append(headers, "Accept: Agent-007"); 
headers = curl_slist_append(headers, "Host: munged.host.line"); 

剔除消息头
对此一个曾经是的消息头,设置它的情节为空,libcurl在殡葬请求时便无会见以提交该消息头:

headers = curl_slist_append(headers, "Accept:");

 

六、获取http应答头信息

   
发出http请求后,服务器会返回应答头信息和报数据,如果单单是打印应答头的有内容,则直接可以经curl_easy_setopt(curl,
CURLOPT_HEADERFUNCTION,
打印函数)的方法来完成,这里要获得的凡诺答头中一定的音,比如许答码、cookies列表等,则需要通过下这函数:
    CURLcode curl_easy_getinfo(CURL *curl, CURLINFO info, …
); 

    info参数就是咱们用获得之始末,下面是一些参数值:
    1.CURLINFO_RESPONSE_CODE
    获取应答码
    2.CURLINFO_HEADER_SIZE
    头大小
    3.CURLINFO_COOKIELIST
    cookies列表

   
除了得到应答信息外,这个函数还能博得curl的有内消息,如请时、连接时间等等。

    更多的参数可以参考API文档。

 

七、多线程问题
    首先一个主导规则就是是:绝对不该当线程之间并享同一个libcurl
handle(CURL *目标),不管是easy handle还是multi
handle(本文就介绍easy_handle)。一个线程每次只能使一个handle。
    libcurl是线程安全的,但出星星点点沾不同:信号(signals)和SSL/TLS handler。
信号用于超时失效名字解析(timing out name
resolves)。libcurl依赖其他的库房来支持SSL/STL,所以用几近线程的方法访HTTPS或FTPS的URL时,应该满足这些库对多线程
操作的有求。详细可参见:
   
OpenSSL: http://www.openssl.org/docs/crypto/threads.html#DESCRIPTION

   
GnuTLS: http://www.gnu.org/software/gnutls/manual/html_node/Multi_002dthreaded-applications.html

    NSS: 宣称是多线程安全的。

八、什么时libcurl无法正常工作
   
传输失败总是发生原因的。你也许错误的安装了有的libcurl的特性或者无是的知一些性能之含义,或者是长途主机返回一些无法让科学解析的情节。
   
这里产生一个黄金法则来处理这些问题:将CURLOPT_VERBOSE属性设置为1,libcurl会输出通信过程遭到之组成部分细节。如果使用的凡http协
议,请求头/响应头也会于输出。将CURLOPT_HEADER设为1,这些头信息用出现在信息的情节中。
    当然不可否认的凡,libcurl还存bug。
    如果你针对系的协议了解进一步多,在使用libcurl时,就更加不爱犯错。

九、关于密码
   
客户端向服务器发送请求时,许多商谈还求提供用户称及密码。libcurl提供了余方来安装它们。
    一些合计支持以URL中直接指定用户称与密码,类似于:
protocol://user:password@example.com/path/。libcurl能是的辨识这种URL中之用户称以及密码并推行
相应的操作。如果您提供的用户称与密码被出特殊字符,首先应本着其展开URL编码。
    也堪由此CURLOPT_USERPWD属性来设置用户称及密码。参数是格式如
“user:password ”的字符串:
    curl_easy_setopt(easy_handle, CURLOPT_USERPWD,
“user_name:password”)

   
有时候在访代理服务器的时段,可能随时要求提供用户称及密码进行用户身份验证。这种景象下,libcurl提供了其他
一个属性CURLOPT_PROXYUSERPWD:
    curl_easy_setopt(easy_handle, CURLOPT_PROXYUSERPWD,
“user_name:password”);
 
   
在UNIX平台下,访问FTP的用户称和密码或会见吃封存在$HOME/.netrc文件中。libcurl支持直接打者文件被落用户称及密码:
    curl_easy_setopt(easy_handle, CURLOPT_NETRC, 1L); 
   
在用SSL时,可能要提供一个私钥用于数据安全传输,通过CURLOPT_KEYPASSWD来装私钥:
    curl_easy_setopt(easy_handle, CURLOPT_KEYPASSWD,
“keypassword”);

十、HTTP验证
    在应用HTTP协议时,客户端有酷多种方朝着服务器提供证明信息。默认的
HTTP验证方法是”Basic”,它将用户称及密码为公开的方法、经Base64编码后保存在HTTP请求头中,发朝服务器。当然就不顶安全。
    当前版的libcurl支持的辨证办法发生:basic, Digest, NTLM, Negotiate,
GSS-Negotiate and
SPNEGO。(译者感叹:搞Web这么多年,尽然不晓这些Http的证明办法,实在惭愧。)可以通过CURLOPT_HTTPAUTH属性来安装具体
的验证方式:
    curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH,
CURLAUTH_DIGEST);

   
向代理服务器发送验证信息时,可以透过CURLOPT_PROXYAUTH设置验证方式:
    curl_easy_setopt(easy_handle, CURLOPT_PROXYAUTH,
CURLAUTH_NTLM);

    也得又设置多征措施(通过按位与),
使用‘CURLAUTH_ANY‘将允许libcurl可以择其它它所支撑的验证方式。通过CURLOPT_HTTPAUTH或
CURLOPT_PROXYAUTH属性设置的又证措施,libcurl会在运作时选一样种植它认为是无限好的计同服务器通信:
    curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH,
CURLAUTH_DIGEST|CURLAUTH_BASIC); 

    // curl_easy_setopt(easy_handle, CURLOPT_HTTPAUTH,
CURLAUTH_ANY);

 

十一、代码示例

下载的libcurl中打带了不少示范代码,在docs\examples目录下,建议下充斥该库后好看一下这些代码。

libcurl的API文档在docs\libcurl\index.html中。

1.基本的http GET/POST操作

ACCESS 4

#include <stdio.h>
#include <curl/curl.h>
bool getUrl(char *filename)
{
    CURL *curl;
    CURLcode res;
    FILE *fp;
    if ((fp = fopen(filename, "w")) == NULL)  // 返回结果用文件存储
        return false;
    struct curl_slist *headers = NULL;
    headers = curl_slist_append(headers, "Accept: Agent-007");
    curl = curl_easy_init();    // 初始化
    if (curl)
    {
        //curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");// 代理
        curl_easy_setopt(curl, CURLOPT_HTTPHEADER, headers);// 改协议头
        curl_easy_setopt(curl, CURLOPT_URL,"http://www.baidu.com");
        curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp); //将返回的http头输出到fp指向的文件
        curl_easy_setopt(curl, CURLOPT_HEADERDATA, fp); //将返回的html主体数据输出到fp指向的文件
        res = curl_easy_perform(curl);   // 执行
        if (res != 0) {

            curl_slist_free_all(headers);
            curl_easy_cleanup(curl);
        }
        fclose(fp);
        return true;
    }
}
bool postUrl(char *filename)
{
    CURL *curl;
    CURLcode res;
    FILE *fp;
    if ((fp = fopen(filename, "w")) == NULL)
        return false;
    curl = curl_easy_init();
    if (curl)
    {
        curl_easy_setopt(curl, CURLOPT_COOKIEFILE, "/tmp/cookie.txt"); // 指定cookie文件
        curl_easy_setopt(curl, CURLOPT_POSTFIELDS, "&logintype=uid&u=xieyan&psw=xxx86");    // 指定post内容
        //curl_easy_setopt(curl, CURLOPT_PROXY, "10.99.60.201:8080");
        curl_easy_setopt(curl, CURLOPT_URL, " http://mail.sina.com.cn/cgi-bin/login.cgi ");   // 指定url
        curl_easy_setopt(curl, CURLOPT_WRITEDATA, fp);
        res = curl_easy_perform(curl);
        curl_easy_cleanup(curl);
    }
    fclose(fp);
    return true;
}
int main(void)
{
    getUrl("/tmp/get.html");
    postUrl("/tmp/post.html");
}

ACCESS 5

编译gcc  get_post.c  -o get_post –lcurl

./ get_post

2 获取html网页

ACCESS 6

#include <stdio.h>
#include <curl/curl.h>
#include <stdlib.h>
int main(int argc, char *argv[])
{
    CURL *curl;             //定义CURL类型的指针
CURLcode res;           //定义CURLcode类型的变量,保存返回状态码
    if(argc!=2)
    {
        printf("Usage : file <url>;\n");
        exit(1);
    }

    curl = curl_easy_init();        //初始化一个CURL类型的指针
    if(curl!=NULL)
    {
        //设置curl选项. 其中CURLOPT_URL是让用户指 定url. argv[1]中存放的命令行传进来的网址
        curl_easy_setopt(curl, CURLOPT_URL, argv[1]);        
        //调用curl_easy_perform 执行我们的设置.并进行相关的操作. 在这 里只在屏幕上显示出来.
        res = curl_easy_perform(curl);
        //清除curl操作.
        curl_easy_cleanup(curl);
    }
    return 0;
}

ACCESS 7

编译gcc  get_http.c  -o get_http –lcurl

./ get_http www.baidu.com

 

3 网页下载保存实例

ACCESS 8

// 采用CURLOPT_WRITEFUNCTION 实现网页下载保存功能
#include <stdio.h>;
#include <stdlib.h>;
#include <unistd.h>;

#include <curl/curl.h>;
#include <curl/types.h>;
#include <curl/easy.h>;

FILE *fp;  //定义FILE类型指针
//这个函数是为了符合CURLOPT_WRITEFUNCTION而构造的
//完成数据保存功能
size_t write_data(void *ptr, size_t size, size_t nmemb, void *stream)  
{
    int written = fwrite(ptr, size, nmemb, (FILE *)fp);
    return written;
}

int main(int argc, char *argv[])
{
    CURL *curl;

    curl_global_init(CURL_GLOBAL_ALL);  
    curl=curl_easy_init();
    curl_easy_setopt(curl, CURLOPT_URL, argv[1]);  

    if((fp=fopen(argv[2],"w"))==NULL)
    {
        curl_easy_cleanup(curl);
        exit(1);
    }
////CURLOPT_WRITEFUNCTION 将后继的动作交给write_data函数处理
    curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, write_data);  
    curl_easy_perform(curl);
    curl_easy_cleanup(curl);
    exit(0);
}

ACCESS 9

编译gcc  save_http.c  -o save_http –lcurl
./ save_http www.baidu.com
  /tmp/baidu

4 快久实例显示文件下载速度

ACCESS 10

// 采用CURLOPT_NOPROGRESS, CURLOPT_PROGRESSFUNCTION    CURLOPT_PROGRESSDATA 实现文件传输进度提示功能
//函数采用了gtk库,故编译时需指定gtk库
//函数启动专门的线程用于显示gtk 进度条bar
#include <stdio.h>
#include <gtk/gtk.h>
#include <curl/curl.h>
#include <curl/types.h> /* new for v7 */
#include <curl/easy.h> /* new for v7 */

GtkWidget *Bar;
////这个函数是为了符合CURLOPT_WRITEFUNCTION而构造的
//完成数据保存功能
size_t my_write_func(void *ptr, size_t size, size_t nmemb, FILE *stream)
{
  return fwrite(ptr, size, nmemb, stream);
}
//这个函数是为了符合CURLOPT_READFUNCTION而构造的
//数据上传时使用
size_t my_read_func(void *ptr, size_t size, size_t nmemb, FILE *stream)
{
  return fread(ptr, size, nmemb, stream);
}
//这个函数是为了符合CURLOPT_PROGRESSFUNCTION而构造的
//显示文件传输进度,t代表文件大小,d代表传 输已经完成部分
int my_progress_func(GtkWidget *bar,
                     double t, /* dltotal */
                     double d, /* dlnow */
                     double ultotal,
                     double ulnow)
{
/*  printf("%d / %d (%g %%)\n", d, t, d*100.0/t);*/
  gdk_threads_enter();
  gtk_progress_set_value(GTK_PROGRESS(bar), d*100.0/t);
  gdk_threads_leave();
  return 0;
}

void *my_thread(void *ptr)
{
  CURL *curl;
  CURLcode res;
  FILE *outfile;
  gchar *url = ptr;

  curl = curl_easy_init();
  if(curl)
  {
    outfile = fopen("test.curl", "w");

    curl_easy_setopt(curl, CURLOPT_URL, url);
    curl_easy_setopt(curl, CURLOPT_WRITEDATA, outfile);
    curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, my_write_func);
    curl_easy_setopt(curl, CURLOPT_READFUNCTION, my_read_func);
    curl_easy_setopt(curl, CURLOPT_NOPROGRESS, 0L);
    curl_easy_setopt(curl, CURLOPT_PROGRESSFUNCTION, my_progress_func);
    curl_easy_setopt(curl, CURLOPT_PROGRESSDATA, Bar);

    res = curl_easy_perform(curl);

    fclose(outfile);
    /* always cleanup */
    curl_easy_cleanup(curl);
  }

  return NULL;
}

int main(int argc, char **argv)
{
  GtkWidget *Window, *Frame, *Frame2;
  GtkAdjustment *adj;

  /* Must initialize libcurl before any threads are started */
  curl_global_init(CURL_GLOBAL_ALL);

  /* Init thread */
  g_thread_init(NULL);

  gtk_init(&argc, &argv);
  Window = gtk_window_new(GTK_WINDOW_TOPLEVEL);
  Frame = gtk_frame_new(NULL);
  gtk_frame_set_shadow_type(GTK_FRAME(Frame), GTK_SHADOW_OUT);
  gtk_container_add(GTK_CONTAINER(Window), Frame);
  Frame2 = gtk_frame_new(NULL);
  gtk_frame_set_shadow_type(GTK_FRAME(Frame2), GTK_SHADOW_IN);
  gtk_container_add(GTK_CONTAINER(Frame), Frame2);
  gtk_container_set_border_width(GTK_CONTAINER(Frame2), 5);
  adj = (GtkAdjustment*)gtk_adjustment_new(0, 0, 100, 0, 0, 0);
  Bar = gtk_progress_bar_new_with_adjustment(adj);
  gtk_container_add(GTK_CONTAINER(Frame2), Bar);
  gtk_widget_show_all(Window);

  if (!g_thread_create(&my_thread, argv[1], FALSE, NULL) != 0)
    g_warning("can't create the thread");


  gdk_threads_enter();
  gtk_main();
  gdk_threads_leave();
  return 0;
}

ACCESS 11

编译export PKG_CONFIG_PATH=/usr/lib/pkgconfig/
gcc progress.c –o progress ` pkg-config –libs –cflags gtk+-2..0`
-lcurl –lgthread-2.0
./ progress  http://software.sky-union.cn/index.asp

5 断点续传实例

ACCESS 12

//采用CURLOPT_RESUME_FROM_LARGE 实现文件断点续传功能
#include <stdlib.h>
#include <stdio.h>
#include <sys/stat.h>

#include <curl/curl.h>
//这个函数为CURLOPT_HEADERFUNCTION参数构造
/* 从http头部获取文件size*/
size_t getcontentlengthfunc(void *ptr, size_t size, size_t nmemb, void *stream) {
       int r;
       long len = 0;

       /* _snscanf() is Win32 specific */
       // r = _snscanf(ptr, size * nmemb, "Content-Length: %ld\n", &len);
 r = sscanf(ptr, "Content-Length: %ld\n", &len);
       if (r) /* Microsoft: we don't read the specs */
              *((long *) stream) = len;

       return size * nmemb;
}

/* 保存下载文件 */
size_t wirtefunc(void *ptr, size_t size, size_t nmemb, void *stream)
{
        return fwrite(ptr, size, nmemb, stream);
}

/*读取上传文件 */
size_t readfunc(void *ptr, size_t size, size_t nmemb, void *stream)
{
       FILE *f = stream;
       size_t n;

       if (ferror(f))
              return CURL_READFUNC_ABORT;

       n = fread(ptr, size, nmemb, f) * size;

       return n;
}

// 下载 或者上传文件函数
int download(CURL *curlhandle, const char * remotepath, const char * localpath,
           long timeout, long tries)
{
       FILE *f;
       curl_off_t local_file_len = -1 ;
       long filesize =0 ;

       CURLcode r = CURLE_GOT_NOTHING;
       int c;
  struct stat file_info;
  int use_resume = 0;
  /* 得到本地文件大小 */
  //if(access(localpath,F_OK) ==0)

    if(stat(localpath, &file_info) == 0) 
     {
        local_file_len =  file_info.st_size;
        use_resume  = 1;
      }
  //采用追加方式打开文件,便于实现文件断点续传工作
       f = fopen(localpath, "ab+"); 
       if (f == NULL) {
              perror(NULL);
              return 0;
       }

       //curl_easy_setopt(curlhandle, CURLOPT_UPLOAD, 1L);

       curl_easy_setopt(curlhandle, CURLOPT_URL, remotepath);

              curl_easy_setopt(curlhandle, CURLOPT_CONNECTTIMEOUT, timeout);  // 设置连接超时,单位秒
       //设置http 头部处理函数
       curl_easy_setopt(curlhandle, CURLOPT_HEADERFUNCTION, getcontentlengthfunc);
       curl_easy_setopt(curlhandle, CURLOPT_HEADERDATA, &filesize);
 // 设置文件续传的位置给libcurl
       curl_easy_setopt(curlhandle, CURLOPT_RESUME_FROM_LARGE, use_resume?local_file_len:0);

       curl_easy_setopt(curlhandle, CURLOPT_WRITEDATA, f);
       curl_easy_setopt(curlhandle, CURLOPT_WRITEFUNCTION, wirtefunc);

       //curl_easy_setopt(curlhandle, CURLOPT_READFUNCTION, readfunc);
       //curl_easy_setopt(curlhandle, CURLOPT_READDATA, f);
       curl_easy_setopt(curlhandle, CURLOPT_NOPROGRESS, 1L);
       curl_easy_setopt(curlhandle, CURLOPT_VERBOSE, 1L);


  r = curl_easy_perform(curlhandle);


       fclose(f);

       if (r == CURLE_OK)
              return 1;
       else {
              fprintf(stderr, "%s\n", curl_easy_strerror(r));
              return 0;
       }
}

int main(int c, char **argv) {
       CURL *curlhandle = NULL;

       curl_global_init(CURL_GLOBAL_ALL);
       curlhandle = curl_easy_init();

       //download(curlhandle, "ftp://user:pass@host/path/file", "C:\\file", 0, 3);
  download(curlhandle , "http://software.sky-union.cn/index.asp","/work/index.asp",1,3);
       curl_easy_cleanup(curlhandle);
       curl_global_cleanup();

       return 0;
}

ACCESS 13

编译gcc  resume.c  -o resume –lcurl
./ resume  

以上转自:http://www.cnblogs.com/moodlxs/archive/2012/10/15/2724318.html

 

自我的品类的代码:

int  Query(char *Url)
 {

    ContentPage.Init();
    CURL *curl;
    char curl_errbuf[CURL_ERROR_SIZE];
    curl = curl_easy_init();
    curl_easy_setopt(curl, CURLOPT_URL, Url);
    curl_easy_setopt(curl, CURLOPT_ERRORBUFFER, curl_errbuf);
    curl_easy_setopt(curl, CURLOPT_NOPROGRESS, 0L);
    curl_easy_setopt(curl, CURLOPT_VERBOSE, 1L);
    curl_easy_setopt(curl, CURLOPT_WRITEFUNCTION, PraseHtml::CurlBodyProc);
    curl_easy_setopt(curl, CURLOPT_WRITEDATA, &ContentPage);
    int err=curl_easy_perform(curl);
    curl_easy_cleanup(curl);

    return err;
 }

转载请注明出处:http://www.cnblogs.com/fnlingnzb-learner/p/5835411.html

相关文章