MENU

从一道 CTF 题学到的几个 Python 字符串处理 tricks

July 19, 2016 • Read: 6413 • CTF

汪神的 Javis OJ 上了几道新题目,其中有一道 CFF 2016 的 “德军密码” 做了挺长时间的。原理也不难,就是一个异或加密,但是写脚本的时候学到了一点 Python 字符串处理的一些小技巧。

题目解析

已知将一个flag以一种加密形式为使用密钥进行加密,使用密钥WELCOMETOCFF加密后密文为
000000000000000000000000000000000000000000000000000101110000110001000000101000000001
请分析出flag。Flag为12位大写字母

密文很明显是二进制码,而一个字节 8 位,12位大写字母应该是 96 位的密文才对,而给出的密文只有 84 位,可能是做过处理,补个 0 看看吧。将密钥与补位后的密文异或一下就可以拿到 flag 了,还是挺简单的。

WELCOMECISRG

解密脚本

脚本里有几处字符串处理的小技巧还是挺有意思的。

# coding=utf-8
import re

def b2ten(string):
    split = re.findall(r'.{7}', string)
    ten = []
    for i in split:
        ten.append(int(i, base=2))
    return ten

a = '000000000000000000000000000000000000000000000000000101110000110001000000101000000001'

b = 'WELCOMETOCFF'
b2ascii = map(ord, b)
# b2binary = map('{:08b}'.format, b2ascii)
# b_bin = ''.join(b2binary)
# print b_bin

# c = ''
# for i in range(len(a_ten)):
#     c += str(ord(a_chuli[i]) ^ ord(b_bin[i]))  
# print c

a_ten = b2ten(a)

c = []
for i in range(len(a_ten)):
    c.append(a_ten[i] ^ b2ascii[i])
print ''.join(map(chr, c))

固定长度分割字符串

有篇帖子提到了两种方法,都挺简便的。

方法一:函数,优点是可以随便定义分割长度

def fix_width_split(string, width):
    return [string[x : x + width] for x in range(0, len(string), width)]

print fix_width_split('123456789', 3)

方法二:正则,优点是代码简单

import re

string = '123456789'
split = re.findall(r'.{7}', string)

format 函数的使用

语法

它通过{}:来代替%

通过位置

In [1]: '{0},{1}'.format('kzc',18) 
Out[1]: 'kzc,18'
In [2]: '{},{}'.format('kzc',18) 
Out[2]: 'kzc,18'
In [3]: '{1},{0},{1}'.format('kzc',18) 
Out[3]: '18,kzc,18'

字符串的format函数可以接受不限个参数,位置可以不按顺序,可以不用或者用多次,不过2.6不能为空{},2.7才可以。

通过关键字参数

In [5]: '{name},{age}'.format(age=18,name='kzc') 
Out[5]: 'kzc,18'

通过对象属性

class Person: 
  def __init__(self,name,age): 
    self.name,self.age = name,age 
    def __str__(self): 
      return 'This guy is {self.name},is {self.age} old'.format(self=self) 

通过下标

In [7]: p=['kzc',18]
In [8]: '{0[0]},{0[1]}'.format(p)
Out[8]: 'kzc,18'

格式限定符

它有着丰富的的“格式限定符”(语法是{}中带:号),比如:

填充与对齐

填充常跟对齐一起使用。

^<>分别是居中、左对齐、右对齐,后面带宽度。

:号后面带填充的字符,只能是一个字符,不指定的话默认是用空格填充。

比如

In [15]: '{:>8}'.format('189')
Out[15]: '   189'
In [16]: '{:0>8}'.format('189')
Out[16]: '00000189'
In [17]: '{:a>8}'.format('189')
Out[17]: 'aaaaa189'

精度与类型f

精度常跟类型f一起使用。

In [44]: '{:.2f}'.format(321.33345)
Out[44]: '321.33'

其他类型

主要就是进制了,b、d、o、x分别是二进制、十进制、八进制、十六进制。

In [54]: '{:b}'.format(17)
Out[54]: '10001'
In [55]: '{:d}'.format(17)
Out[55]: '17'
In [56]: '{:o}'.format(17)
Out[56]: '21'
In [57]: '{:x}'.format(17)
Out[57]: '11'
In [5]: '{:0>8b}'.format(17)    # 8位二进制,不足补0
Out[5]: '00010001'

用,号还能用来做金额的千位分隔符。

In [47]: '{:,}'.format(1234567890)
Out[47]: '1,234,567,890'
Last Modified: February 14, 2017
Archives QR Code
QR Code for this page
Tipping QR Code
Leave a Comment

2 Comments
  1. 1 1

    德军密码那道题并不用补0, 84/7 == 12

    1. @1对,不补也可以