30

golang的net/http包的客户端简单科普

 4 years ago
source link: https://www.tuicool.com/articles/BBniYvN
Go to the source link to view the article. You can view the picture content, updated content and better typesetting reading experience. If the link is broken, please click the button below to view the snapshot at that time.

之前准备写个简单的api的调用,百度和问了很多人后发现基本对于http的客户端熟悉的人非常少。或者对包的不了解自己造了效率很低的轮子,而且官方一些包里有坑,被坑过,这里简单科普下

简单的get和post

http包里下列可以直接使用的请求方法

func Head(url string) (resp *Response, err error)
func Get(url string) (resp *Response, err error)
func Post(url string, bodyType string, body io.Reader) (resp *Response, err error)
func PostForm(url string, data url.Values) (resp *Response, err error)

变量 DefaultClient 是用于包函数Get、Head和Post的默认Client。

var DefaultClient = &Client{}

例如简单的直接调用

package main
import "net/http"

func main(){
    resp, err := http.Get("http://example.com/")
    ...
    resp, err := http.Post("http://example.com/upload", "image/jpeg", &buf)
    ...
    resp, err := http.PostForm("http://example.com/form",
        url.Values{"key": {"Value"}, "id": {"123"}})
}

设置header

看源码,发现默认的http.Get是调用默认客户端的Get方法

func Get(url string) (resp *Response, err error) {
	return DefaultClient.Get(url)
}

而Client的Get方法里是先new了一个request对象后调用 Client.Do 方法来发请求

func (c *Client) Get(url string) (resp *Response, err error) {
	req, err := NewRequest("GET", url, nil)
	if err != nil {
		return nil, err
	}
	return c.Do(req)
}
...
func (c *Client) Do(req *Request) (*Response, error) {
	return c.do(req)
}

http.NewRequest返回一个 *RequestRequest 结构体里有header成员

type Request struct {
    ...
    Header Header

Header 类型实现了以下方法来设置和获取发请求时候的请求头

type Header map[string][]string


func (h Header) Add(key, value string) {
	textproto.MIMEHeader(h).Add(key, value)
}


func (h Header) Set(key, value string) {
	textproto.MIMEHeader(h).Set(key, value)
}


func (h Header) Get(key string) string {
	return textproto.MIMEHeader(h).Get(key)
}

所以自定制header可以这样写,用 http.NewRequest 来new一个请求,然后用请求的 Header.Set 去设置header,然后最后去调用客户端的 Do(req) 发起请求

package main
import "net/http"

func main(){
    req, err := http.NewRequest("GET", "http://example.com/", nil)
    req.Header.Set("Origin", "xxxxxx")
	req.Header.Set("Accept-Encoding", "gzip, deflate, br")
	req.Header.Set("Accept-Language", "zh-CN,zh;q=0.9")
	req.Header.Set("User-Agent", "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36")
	req.Header.Set("Content-Type", "application/json")
	req.Header.Set("Accept", "application/json, text/javascript, */*; q=0.01")
	req.Header.Set("Referer", "xxxxxx")
	req.Header.Set("X-Requested-With", "XMLHttpRequest")
	req.Header.Set("Connection", "keep-alive")
    req.Header.Set("X-Csrftoken", "xxxxxx")

    resp, err := http.DefaultClient.Do(req)
}

例如发起一个post请求

jar, _ := cookiejar.New(nil)
http = &http.Client{}

body := strings.NewReader(`username=admin&password=Password%40_`)
req, err := http.NewRequest("POST", sessionUrl, body)
if err != nil {
	return h, err

req.Header.Set("Accept-Encoding", "gzip, deflate, br")
req.Header.Set("Accept-Language", "zh-CN,zh;q=0.9")
req.Header.Set("User-Agent", "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36")
req.Header.Set("Content-Type", "application/x-www-form-urlencoded; charset=UTF-8")
req.Header.Set("Accept", "application/json, text/javascript, */*; q=0.01")
req.Header.Set("Referer", baseUrl)
req.Header.Set("X-Requested-With", "XMLHttpRequest")
req.Header.Set("Connection", "keep-alive")

resp, err := http.Do(req)
if err != nil {
	return err //errors.New("Login Timeout")
}
defer resp.Body.Close()

respBody, err := ioutil.ReadAll(resp.Body)
if err != nil {
	return err
}
var data = &CSR{}
if err := json.Unmarshal(respBody, data); err != nil {
	return err
}
//fmt.Println(string(respBody))
if data.PasswordModify != 0 {
	return errors.New("Password Wrong")
}
return nil

自定义客户端

上面都是使用的包里定义的默认客户端,例如有些网站的证书不是权威证书,我们得关闭客户端的权威证书检查,类似于 curl -k 那样。或者设置客户端超时时间

client = &http.Client{
        Timeout: time.Second * 3, 
        Transport: &http.Transport{
            TLSClientConfig: &tls.Config{InsecureSkipVerify: true},
        },
    }
req, err := http.NewRequest("GET", "http://example.com/", nil)
resp, err := client.Do(req)

cookies

上面都是些不需要登陆的,或者说不是那种接口式的网站,接口的网站一般是先basicAuth或者oAuth2啥的请求了获取了一个token,后续调接口带上token请求就行了,不需要设置header啥的。但是也有网站不提供接口的,所以一般需要http客户端的记录session模拟人为登陆。

而session就是体现在http的header的 cookie: xxx=yyy; aaa=bbb; session_id=93728560xxxx; ..... 里(http的header的key不区分大小写),客户端请求后,服务器端回应的时候会带上 Set-cookie 然后客户端会自行去把键值对写到cookie里。有的网站把token放在cookies里作为认证的身份,例如以前的百度贴吧的自动签到和pandownload的登陆下载都是叫用户自己找cookie里的那几个字段的值写进去,程序会带着它去请求。cookie里的很多字段看各个web server的控制了,这里不细致讨论。

我们使用浏览器会自动的去 Set-cookie ,那么源码里肯定也有对应的代码段,Do方法最后调用的send方法发送请求

func (c *Client) send(req *Request, deadline time.Time) (resp *Response, didTimeout func() bool, err error) {
	if c.Jar != nil {
		for _, cookie := range c.Jar.Cookies(req.URL) {
			req.AddCookie(cookie)
		}
	}
	resp, didTimeout, err = send(req, c.transport(), deadline)
	if err != nil {
		return nil, didTimeout, err
	}
	if c.Jar != nil {
		if rc := resp.Cookies(); len(rc) > 0 {
			c.Jar.SetCookies(req.URL, rc)
		}
	}
	return resp, nil, nil
}

如果客户端的 .Jar 不为空就会去 SetCookies ,所以我们使用cookies也可以自行在header里自动去写,这样做法是浏览器登录后F12打开network抓包,点击到请求里找

yqmYf2y.png!web

找到后自行 req.Header.Set("Cookie", "xxxxxx") 或者 req.AddCookie(xxx) ,这样非常繁琐,所以一般我们是新建一个客户端把客户端的Jar不设置为空就行了

jar, _ := cookiejar.New(nil)
h.http = &http.Client{
	...
       Jar: jar,
       ...
}

这样后续使用这个客户端的时候就和我们使用浏览器一样会自动处理服务端发的cookie操作了,会保持住session

multipart/form-data

http上传文件的时候是把文件分段上传的,会生成一个随机字符(boundary)来分割每段

VvEvMrF.png!web

boundary是各自的http客户端生成的,chrome好像和其他的不一样,总之上传文件的type为

Content-Type: multipart/form-data; boundary=分割文件时候的随机字符

type里的boundary是随机的,所以我们得用包 "mime/multipart" 处理

import (
    "bytes"
    "fmt"
    "io"
    "io/ioutil"
    "mime/multipart"
    "net/http"
    "os"
)

func postFile(filename string, targetUrl string) error {
    bodyBuf := &bytes.Buffer{}  //创建缓存
    bodyWriter := multipart.NewWriter(bodyBuf) // 创建part的writer

    //关键的一步操作,fwimage自行看上图抓包里的,而且这里最好用filepath.Base取文件名不要带路径
    fileWriter, err := bodyWriter.CreateFormFile("fwimage", filepath.Base(filename))
    if err != nil {
        fmt.Println("error writing to buffer")
        return err
    }


    fh, err := os.Open(filename)
    if err != nil {
        fmt.Println("error opening file")
        return err
    }
    defer fh.Close()

    //iocopy
    _, err = io.Copy(fileWriter, fh)
    if err != nil {
        return err
    }

    bodyWriter.Close()   // 必须在发请求之前关闭,不然不会读到EOF

    req, err := http.NewRequest("POST", Url, bodyBuffer)
    if err != nil {
        return err
    }

    ...
    req.Header.Set("Content-Type", bodyWriter.FormDataContentType()) //获取Content-Type的值

    resp, err := http.Do(req)  //自己的客户端去do,不要照抄

    defer resp.Body.Close()
    resp_body, err := ioutil.ReadAll(resp.Body)
    if err != nil {
        return err
    }
    fmt.Println(resp.Status)
    fmt.Println(string(resp_body))
    return nil
}

一些坑

header的host字段

之前把curl写的一套逻辑尝试写到go里,发现一直不对,最后发现了host字段的锅。抓包的接口host字段和请求的url不一样(这种情况虽然不是很热门,但是是存在的,例如我们命令行访问ip,设置header模拟访问域名),后面没办法去掉host的header设定就可以了

具体移步 https://github.com/golang/go/issues/7682

上传文件的type

官方函数CreateFormFile限制了Content-Type为 application/octet-stream 而且并不打算改,很多时候后端的时候会重视这个type。可以看到之前我的浏览器抓包的type是 application/octet-binary 所以我们可以写个下面的函数处理

func createAudioFormFile(w *multipart.Writer, fieldname, filename string) (io.Writer, error) {
	h := make(textproto.MIMEHeader)
	h.Set("Content-Disposition", fmt.Sprintf(`form-data; name="%s"; filename="%s"`, fieldname, filename))
	h.Set("Content-Type", "application/octet-binary")
	return w.CreatePart(h)
}

我们可以这样用

fileWriter, err := bodyWriter.CreateFormFile("fwimage", filepath.Base(filename))
改为
fileWriter, _ := createAudioFormFile(bodyWriter,"fwimage", filepath.Base(filename))

json的坑

下面这张图可能看不出啥问题,但是是问题的一部分,调用的接口的数据经过了cdn,int类型经常出现 .0 的数字导致我写错类型json.Unmarshal报错

003.png

About Joyk


Aggregate valuable and interesting links.
Joyk means Joy of geeK