依云's Blog

8
28
2012

10

UDP打洞实验

两台没有外网 IP、在 NAT 后边的主机如何直连？UDP打洞通常可行，但是需要第三方服务器。方法如下：

在服务器 S 上监听一个 UDP 端口，在收到 UDP 数据包后把源地址发回去。代码如下（github）：

import sys
import time
import socket

def main(port):
  s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
  s.bind(('', port))
  try:
    while True:
      data, addr = s.recvfrom(4096)
      back = 'Your address is %r\n' % (addr,)
      s.sendto(back.encode(), addr)
      print(time.strftime('%Y-%m-%d %H:%M:%S'), addr, 'just sent us a message:', data.decode('utf-8', 'replace'), end='')
  except KeyboardInterrupt:
    print()

if __name__ == '__main__':
  try:
    main(int(sys.argv[1]))
  except (ValueError, IndexError):
    sys.exit('which port to listen?')

主机 A 发送数据包：

$ socat readline udp:xmpp.vim-cn.com:2727,sourceport=4567
my addr?
Your address is ('a.b.c.d', 40060)

输入任意消息并回车，一个 UDP 就从本地的 4567 发送出去了。从上述示例我们可以看到，NAT 设备转发时是从 40060 端口发送出去的。为了让服务器返回的数据能够到达内网主机，在一段时间内，NAT 设备会记住外网来自 40060 端口的 UDP 数据包要发送给主机 a.b.c.d 的 4567 端口。完全圆锥型NAT不会在意外部数据包是从什么地方发回来的。受限圆锥型NAT会忽略掉其它主机的数据包，上例中只认可来自 xmpp.vim-cn.com 的数据包。端口受限圆锥型NAT更进一步地要求源端口（上例中是 2727）必须跟之前发出的数据包的目的端口一致。当然，「之前发出的数据包」不必是最后一个。所以，除了最后一种——对称NAT——之外，其它类型的NAT都是有可能成功穿透的。参见维基百科条目网络地址转换和STUN。

后来通过 pystun 程序，我得知我所处的 NAT 是完全圆锥型的。

在知道 A 的发送地址后，主机 B 就可以向这个地址发送数据了。接下来的操作使用 socat 命令就是：

# host A
$ socat readline udp-listen:4567
# host B
$ socat readline udp:A:4567

然后 B 先发送数据让 A 知道 B 的地址（socat 会 connect 到这个地址），双方就可以相互通信了。当然，因为是 UDP 协议，所以通信是不可靠的，丢包啊乱序啊都有可能。

2013年10月13日更新：想要连接到 NAT 后边的 mosh 请看这里～

Category: 网络 | Tags: python 网络 socat UDP

8
20
2012

7

GM 脚本：修正 github

从某时起，Github 和 Linux 一样，开始有着越来越多的 bug 和让人不舒服的地方。本文所附的 GreaseMonkey 脚本修正以下问题：

项目首页默认下载文件格式是 zip 而不是 gzip。
新建项目后，从已有项目创建的提示命令使用 HTTPS 而不再是 SSH 协议。这直接导致 git 向用户询问用户名和密码，而不使用用户已经上传并确认的密钥。

Google Code 后来也加入了 git 支持，但是我极少使用。为什么呢？因为我讨厌输入用户名和密码！虽然 Github 没有像 Google Code 那样给你生成个随机密码，但这种麻烦且不安全的方式能避免我就决不容忍。你的密码会比密钥还长吗？你使用密钥时需要输入或者显示密钥的内容吗？？

// ==UserScript==
// @name           github fixes
// @namespace      http://lilydjwg.is-programmer.com/ 
// @description    下载默认 gzip 格式，新建项目时使用 ssh 协议
// @include        https://github.com/*
// @version	   1.4
// @grant          none
// ==/UserScript==
 
var dl = document.querySelector('[icon_class=octicon-cloud-download]');
if(!dl){
  dl = document.querySelector('a[title^=Download]');
}
if(dl){
  dl.title = dl.title.replace('zip', 'gzip');
  dl.href = dl.href.replace(/archive\/[^\/]+.zip/, 'tarball/master');
  var infotext = dl.childNodes[dl.childNodes.length-1];
  infotext.textContent = infotext.textContent.replace('ZIP', 'GZIP');
}

var repourl = document.querySelectorAll('.js-live-clone-url');
var re = /https:\/\/github\.com\/([^\/]+)\/(.*)/;
var span, m;
var i, len;
for(i=0, len=repourl.length; i<len; i++){
  span = repourl[i];
  m = re.exec(span.textContent);
  if(m){
    span.textContent = 'git@github.com:'+m[1]+'/'+m[2];
  }
}

点此安装。

2012年9月9日更新：跟随 github 的更新，修正修改默认下载的格式失败的问题。

2012年11月27日更新：跟随 github 更新，使用带版本号的下载链接地址。

2013年5月17日更新：跟随 github 更新，更新 CSS 选择器。

2013年6月18日更新：支持新版界面。

Category: 版本控制 | Tags: github GreaseMonkey

8
2
2012

14

GM 脚本：桌面浏览器登录招商银行手机版，及 mitmproxy 的初次使用

招商银行网银需要控件，只支持 Windows 和 Mac。但是手机版不需要安装任何软件可直接登录。通过桌面浏览器访问https://mobile.cmbchina.com/MobileHtml/Login/LoginA.aspx可以看到登录界面，但登录时被拒绝，弹出警告「为了您的资产安全，请用手机访问手机银行！」。更改 UserAgent 失败。通过 Firebug 发现其 POST 数据中包含从 JavaScript 取到的navigator.UserAgent、screen.width、screen.height、navigator.platform的值，以 XML 发送给服务器。于是尝试修改之。

这次使用 privoxy 不行了，因为是 HTTPS 加密连接，privoxy 看不到内容。于是用上了前不久才发现的工具mitmproxy，一个支持 SSL 的中间人代理，并支持交互、命令行和脚本化查看、编辑功能。在看了下请求数据后，按i输入要中断的请求的模式-u LoginA，在请求 URL 包含LoginA字样时中断以进行人工编辑。使用j键移动到停下来的橙色请求上：

中断浏览器请求

按回车显示详细信息，按e进行编辑，f选择编辑表单域，编辑完成后退回到请求列表界面，按a继续，再按a接受响应信息。

编辑POST表单

经过多次 Google 和编辑尝试，招行终于不再要求我使用手机访问了。不过很显示，我不能每次登录都使用 mitmproxy 手工编辑对不？于是写了个 GreaseMonkey 脚本。

此脚本用到了unsafeWindow，也就是页面本身中的那个window对象，而不是被GreaseMonkey wrap 过的。这样才能修改页面中定义的函数。注意据说这样做有安全风险。详见 GreaseMonkey Wiki。

~~点击此处安装此脚本~~早已失效。

Category: 火狐 | Tags: GreaseMonkey 火狐 mitmproxy

7
29
2012

1

Revert new site identity feature and show favicon in urlbar for Firefox 14 & 15

（中文文章请见此处。）

If a user can be cheated by a site icon, the user can still be cheated even when you remove that icon.

For the patch for Firefox 14, click here; for the omni.ja file, check this. This includes the long-lost feature that double-clicking on the space in a tab group will open a new tab.

For Firefox 15 patch.The omni.ja file is at the same location.

For Firefox 16 patch.The omni.ja file is at the same location.

Category: 火狐 | Tags: 火狐

7
29
2012

18

调教火狐14&15：地址栏显示网页图标，以及总结

好吧，我确认 Mozilla 已经脑残了，各种我喜欢的特性正在被去除，而我不喜欢的特性正在从 Google Chrome 抄袭过来。

火狐14开始，不再在地址栏显示网站图标了。Mozilla 说这样更安全，可我觉得，对于网站弄个挂锁图标就可以骗过的用户，地址栏图标去掉了他们依然会中招。而标签栏上的图标，我只用来识别标签页。地址栏图标的优势在于，不管标签页在哪里，它的位置总是固定的，用户不需要去判断当前标签页在哪里。于是我费了好久，终于通过查询火狐的源码库把这个特性加回来了。要补丁的请点击此处，我也提供打包好的 omni.ja 文件^GFW认证。其中包含了自火狐7以来失去的双击标签页组创建新标签页的修改。

另外，火狐14地址栏默认自动填充到域名。可是我要域名干什么呢——我要访问的是页面！谁没事老去看人家网站的首页啊，当 RSS 不存在似的……好在我们还有个选项：browser.urlbar.autoFill。把它设置成false就可以了。

接下来，让我们怀念一下那些已经不再默认或者已经去除的特性（链接为找回该特性的办法）——

火狐14
- 取消地址栏的网站图标，可信站点标识变丑了（本文补丁已经包含）
- 默认开启地址栏自动填充
火狐13
- 新建标签页使用缩略图导航
火狐8
- 新建标签页组后光标停留在为其命名的文本框（本文补丁已经包含）
火狐7
- 双击标签页组不再能新建标签页（本文补丁已经包含）
- 地址栏默认隐藏http://和ftp://等
火狐4
- 去掉地址栏的 RSS 图标
- 去掉状态栏

2012年8月30日更新：针对火狐15的补丁，omni.ja文件地址不变。

2012年10月16日更新：针对火狐16的补丁，omni.ja文件地址不变。

2013年4月16日更新：针对火狐20的补丁以及omni.ja文件地址在上述 Wuala 网盘地址中。

2013年11月27日更新：对于火狐 21 及以后，参见这里通过 userChrome 脚本的实现。

Category: 火狐 | Tags: 火狐

7
27
2012

8

fcitx-remote 接口通过 socat 跨主机使用

在使用 Mac OS X 时，我十分想念 fcitx.vim 插件在使用 Vim 时能智能切换输入法的激活状态。所以我换回 Arch Linux 了。关于 Mac OS X 与我的「不兼容」还是留到下次再说，这次解决的问题是，当我 ssh 到另一主机上使用 Vim 时，如何让 fcitx.vim 能够控制本机的输入法状态？

fcitx-remote 接口使用的是 UNIX 套接字文件，因此天生是不能跨主机通信的（因此不用担心局域网里其它人捣乱）。现在，为了进行跨主机通信，当然要使用网络套接字了。既然都是套接字，转发下就可以了嘛。于是想到 socat。

在远程机器监听一个套接字文件，转发到本地机器的 8989 端口：

socat UNIX-LISTEN:/tmp/fcitx-remote.sock,fork TCP:192.168.2.142:8989

在本地监听网络 8989 端口，转发到本地 fcitx 的套接字：

socat tcp-listen:8989,fork UNIX-CONNECT:/tmp/fcitx-socket-\\:0

fcitx.vim 使用更新后的 1.2 版，然后告诉它你要使用的套接字文件地址：

export FCITX_SOCKET=/tmp/fcitx-remote.sock

然后就可以啦～

最后，贴一张测试过程中抓到的 htop 的图片，2 万多进程哦，htop 已经卡了，实际的 load 请看右下角的红色数字。我执行killall socat命令后等了几分钟，终于因为内存耗尽系统开始重新缓慢工作了。数次 killall 后终于恢复正常……再次测试前果断先ulimit -u 1000 :-)

Category: Linux | Tags: fcitx vim 网络 socat

6
20
2012

4

使用 pygit2 创建提交

pygit2 是 libgit2 的 Python 绑定，而 libgit2 是一个可动态链接的 git 库，除去头文件和 pkgconfig 信息就一个 .so 文件。它是我在 The Architecture of Open Source Applications（AOSA）第二巻讲 git 的部分中看到的。git 本身遵循了传统的 Unix 哲学，提供了一系列的命令来管理源码库。这对于 shell 脚本是非常不错，可是对于嵌入到其它应用（如 IDE、Web 服务）中却不太好用。于是，我们有了 libgit2。

很遗憾的是，我并没有找到 API 文档，只有一些示例性的用法介绍，更别提教程之类。即使在 pygit2 中，使用help命令能够得到的信息也很有限。所以，我只能在 Python 这样动态语言的交互式会话时独自探索。

下面是我搜索出来的使用 pygit2 进行提交的过程：

导入需要用到的模块：

import pygit2
import time

我的 git 仓库，还有 index：

repo = pygit2.Repository('/home/lilydjwg/.vim/.git')
ind = repo.index

先看看未提交到 index 的修改（相当于git diff）

print(ind.diff())

唔，我看到就一个plugin/colorizer.vim文件修改了。把它加到 index 中（相当于git add）。如果是git rm的话就用del ind[filename]了。操作之后要调用write()方法写入更改。

ind.add('plugin/colorizer.vim')
ind.write()

写入 tree 对象，其返回值是二进制编码的 hash 值（使用binascii.b2a_hex可编码成 git 命令中使用的字符串）

oid = ind.write_tree()

作者和提交者的信息，其中最后一个参数（offset）是以分钟计的时区偏移（当然是相对于 UTC）。邮件地址很显然被打码了 :-)

author = pygit2.Signature('依云', 'a@b.c', int(time.time()), 480)

创建提交。其中HEAD是个「符号引用」（symbolic reference），而repo.head就是当前最后一个提交了，oid属性还是二进制编码的 hash 啦。这里，提交者和作者是同一人，因此我都使用刚刚创建的author对象了。这步就是git commit命令了。

repo.create_commit('HEAD', author, author, 'colorizer: solved name color conflict', oid, [repo.head.oid])

在命令行下看看结果是否正确：

>>> git cat-file -p HEAD
tree 20e8937d41b6df16da2c8c5661f9c4a8dd31b5a1
parent ab9c662ce0d1cb2deac7a9ae388ecb40d8ec5e15
author 依云 <a@b.c> 1340188028 +0800
committer 依云 <a@b.c> 1340188028 +0800

colorizer: solved name color conflict

Category: python | Tags: python Git

6
17
2012

13

彻底关闭火狐13新建标签页的缩略图导航

我一直在反对新版火狐的某些特性。火狐13在新建标签页时添加了和 Opera、Google Chrome 一样的缩略图导航，这个对我一点用处也没有，因此也得干掉。

我并不满足于单纯地点击右上角那个小图标，因为这样之后，在打开新标签页时，我还是能看到 Status-4-Evar 显示于地址栏的进度条一闪而过。虽然加载新标签页的速度依然远快于 IE8，但是我不会轻易满足的。打开 about:config 页面，搜索「newtab」，我找到了这么一项：

browser.newtab.url ，默认值是about:newtab。果断将其改成about:blank，恢复之前的空白页。

2012年6月27日更新：根据这篇文章，如果要禁止火狐在后台生成缩略图，还需要将选项browser.newtabpage.enabled置为false。（感谢巴蛮子指出。）

Category: 火狐 | Tags: 火狐

6
11
2012

11

rpysh——Windows Python 命令行也要 readline！

rpysh 是为习惯 Linux 的 Pythoners 在不得不处理 Windows 上的事务时写的远程 shell。

源起

前些天，我尝试了使用 Python 控制 Word。但我对 Windows 下的交互式 Python shell 很不满意。

首先，我尝试的是 cmd.exe 那个黑窗口。太难用了！只有最基本的行编辑、在不知不觉中历史记录被窜改、复制粘贴极其麻烦。补全当然也是没有的。

于是，尝试 IDLE。这家伙我选了「IDLE Classic Unix」，但是能工作的键并不多。比如我刚刚尝试的Ctrl-u就不管用。而Ctrl-p竟然是把光标向上移动，回车才会把那行的内容取到输入命令的那行。这样一来，想再次执行最后一条语句，需要视上条命令输出的行数按几下Ctrl-p。另外，鼠标在窗口内点击后光标会被移开。这样，我使用鼠标从其它窗口切回来时，还得再手动定位光标，极其不爽。至于补全么，太智能了，所以在我输入时不时会出现这种情况：

乱七八糟的补全

还有一个问题：我查资料、做笔记、写代码都在 Linux 上，虽然Ctrl-C、Ctrl-V在物理机和虚拟机间能够无缝操作，但比起选中+中键粘贴的 X 主选区还是麻烦多了！

没办法，我只好重拾很久以前的想法——写个程序，在 Linux 上操作，在 Windows 上执行！

——等等！这和 ssh 差不多吗？或者 telnet？

——不不，Cygwin 的 ssh 跑不了 Windows 控制台程序，而且，不还是没 readline 支持么？

实现

毫无疑问是网络通信了。距离上一次不成功的尝试已经过去很久了，我不仅更加了解了code模块的能力，也知道 Python 命令行补全是怎么回事了。也就是说，Windows 版的 Python 是有补全的接口的，只是没有 readline 的等价物来调用。跑在 Windows 上的服务端要完成以下操作：

重写相关方法，把用户数据由标准输入改到从客户端读取
标准输出重定向到网络 socket
收到客户端的补全请求后，使用rlcompleter模块获取补全结果，再回送给客户端

对于第一点，实际上取代code.InteractiveConsole实例的raw_input方法就行。它和内建的input()函数具有相同的输入和输出形式，也就是会接收命令提示符。将这个直接发给客户端好了。

第二点很简单，直接socket.makefile然后把sys.stdout指过去。

第三点，为了简单起见，我另开了个线程和 socket，专门用于补全。需要传递的参数和返回值全部 pickle 了扔给对方就是了。

写完这些我才发现，其实我的raw_input方法和补全函数具有相似的执行逻辑：发送参数到网络，再从网络获取执行结果——也就是远程过程调用呵。

使用方法

rpyshd.py可选一个参数作为端口号，为方便起见，提供默认值8980。也是为了方便双击执行起见，我添加了.py后缀。

rpyshc相当于telnet命令了，直接接主机地址和端口号两个参数即可。

缺陷

从标准输入读数据时在服务端
偶尔提示符出现不及时
虽然我实现了Ctrl-C，但是实际上没什么用，因为收到消息时之前的操作肯定已经执行完了

Category: python | Tags: linux python readline windows

6
6
2012

12

编程获取本机IPv4及IPv6地址

首先，我要通过编程直接获取，而不是去读诸如ifconfig等命令的输出。

其实是只想获取IPv6地址的，不过我猜想它们差不多，也确实看到不少相关搜索结果，于是顺带着看了。

首先，使用gethostbyname查自己通常是不行的，因为可能得到127.0.0.1，而且我猜，这样不能处理拥有多个IPv4地址的情况。另外一种方式是连上某个主机，然后调用getsockname。这样需要能够直接连上那个主机，好处是如果有多个网络接口，这样可以知道到底走的是哪个接口，调试网络时不错。我最满意的方案在这里，使用ioctl来获取。这个方法可以获取指定网络接口的IPv4地址。至于有哪些网络接口嘛，直接读/proc/net/dev吧。

import fcntl
import socket
import struct
ifname = b'eth0'
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
# 0x8915 是 SIOCGIFADDR
ip = socket.inet_ntoa(fcntl.ioctl(s.fileno(), 0x8915, struct.pack('256s', ifname[:15]))[20:24])
print(ip)

然而，这样只能获取IPv4地址。创建个AF_INET6的 socket 传过去会报错「Inappropriate ioctl for device」。那怎么办呢？Google 没找到，我去搜了下内核源码。inet_ioctl里有对SIOCGIFADDR的处理。但是，inet6_ioctl里却没有了。

于是，我只好去下载ifconfig所属的 net-tools 的源码，找到相关代码：

#if HAVE_AFINET6
    /* FIXME: should be integrated into interface.c.   */

    if ((f = fopen(_PATH_PROCNET_IFINET6, "r")) != NULL) {
    while (fscanf(f, "%4s%4s%4s%4s%4s%4s%4s%4s %08x %02x %02x %02x %20s\n",
              addr6p[0], addr6p[1], addr6p[2], addr6p[3],
              addr6p[4], addr6p[5], addr6p[6], addr6p[7],
          &if_idx, &plen, &scope, &dad_status, devname) != EOF) {
        if (!strcmp(devname, ptr->name)) {
        sprintf(addr6, "%s:%s:%s:%s:%s:%s:%s:%s",
            addr6p[0], addr6p[1], addr6p[2], addr6p[3],
            addr6p[4], addr6p[5], addr6p[6], addr6p[7]);

这里就是ifconfig输出IPv6部分的代码了。可以看到它打开了一个奇怪的文件。跟过去，发现是

#define _PATH_PROCNET_IFINET6       "/proc/net/if_inet6"

囧，这个文件我早就发现过了的。看来和IPv4的情况不同，IPv6地址只能通过/proc里的文件获取了。而且输出成人可读格式不容易（ifconfig是自己实现的）。

PS: 我还发现了件好玩的事，在 Linux 源码的include/linux/sockios.h中，SIOCGIFINDEX中的字母 C 写漏了。通过git blame我发现，这个拼写错误在至少七年前 Linux 内核代码迁移到 git 前就修正了。Linus Torvalds 说之前的代码导入到 git 后有 3.2GB。我不得不承认这是个无比正确的决定，因为现在的.git已经有600多兆了，git 不支持断点续传，clone 下来已经很不容易了。

另外，我还联想到了 Unix 系统调用中的creat，以及 HTTP 协议中的referer :D

#define SIOCGIFINDEX    0x8933      /* name -> if_index mapping */
#define SIOGIFINDEX SIOCGIFINDEX    /* misprint compatibility :-)   */

Category: Linux | Tags: C代码 linux python 网络

依云's Blog

Happy coding, happy living!

UDP打洞实验

GM 脚本：修正 github

GM 脚本：桌面浏览器登录招商银行手机版，及 mitmproxy 的初次使用

Revert new site identity feature and show favicon in urlbar for Firefox 14 & 15

调教火狐14&15：地址栏显示网页图标，以及总结

fcitx-remote 接口通过 socat 跨主机使用

使用 pygit2 创建提交

彻底关闭火狐13新建标签页的缩略图导航

rpysh——Windows Python 命令行也要 readline！

源起

实现

使用方法

缺陷

编程获取本机IPv4及IPv6地址

随机文章

最新评论

最新留言

链接

计数器

存档

功能

RSS

权利声明

Happy coding, happy living!

源起

实现

使用方法

缺陷

随机文章

标签云

最新评论

最新留言

链接

计数器

存档

功能

RSS

权利声明