Posts Tagged “cpp”

首先贴两则旧闻:一个是上个月底,IS0 C++委员会正式批准了C++编程语言国际标准最终草案(FDIS)。

标准本身已经完成,接下来将是根据委员会会议修改意见更新工作草案,预计将用三周时间完成FDIS草案,然后交给日内瓦的ITTF,最新的C++标准将在夏天发布,先前被临时命名为C++0x的新标准将被称为C++ 2011。从2003年发布的C++03到2011年的C++ 2011,新标准的制定历经了8年时间。GCC和Visual C++编译器都已加入了C++2011/C++0x的支持。

另一个则是紧接着在3月25日,GCC 4.6.0发布。

GNU项目和GCC开发者正式宣布发布GNU编译器4.6.0版本。 GCC 4.6.0的新特性包括:支持Go语言,改进C++0x支持,可伸缩全程序优化器已能可靠使用,新的-Ofast选项, 无效命令行的严格检查,改进编译时间和内存占用,等等。

而这其中正包括了倍受期待的foreach了,在C++0x,它的正式名字是Range-based for-loop

Comments 9 Comments »

接着上次4道比较简单的题的解题报告写。这次是Detect the Virus IIAn Unusual Problem的解题报告,主要涉及如何在C, C++, Java, Perl, Python中使用正则表达式与及无损压缩算法

ZOJ3440. Detect the Virus II

[regex, topSort]

题目简单来讲就是通过上下文无关语法(context-free grammar, CFG)描述了virus。问一个字符串是否存在virus形式的子串。题目保证描述不会有环/递归。

这题用正则表达式(Regular expressions, regex)来做是再自然不过了,比如sample就等价于下面这段perl代码:

# subparta:=fg|g
$subparta = qr(fg|g);
# parta:=a|b|c
$parta = qr{a|b|c};
# partb:=d|e[subparta]h
$partb = qr{d|e($subparta)h};
# virus:=[parta][partb][partb]
$virus = qr{($parta)($partb)($partb)};

printf 'abcdefghijklm' =~ $virus ? "YES\n" : "NO\n";
printf 'nopqrstuvwxyz' =~ $virus ? "YES\n" : "NO\n";

当然,因为代码是顺序执行的,所以我们调整了几个record的顺序。顺插一句,如果是函数式编程语言的话,那顺序就完全无关紧要了。于是问题就是给定的字符串能否匹配题目所描述的正则表达式,不过因为输入的顺序不确定,所以要麻烦一点,不过即然没有环,一个拓扑排序就搞定了(ZOJ3440watashi2.pl)。

Comments 15 Comments »

熟悉STL或熟悉ACM/ICPC的话,其中的set, map, multiset, multimap一定用过无数次了,它们都是用平衡二叉树(红黑树)实现的,复杂度为O(lgn)。我们也知道set, map可以通过哈希来实现,复杂度只有O(1),可惜直到现在,unsorted_set或hash_map都没能成为C++标准的一部分(C++0x,- -b)。不过无论在GNU GCC中还是Microsoft Visual Studio中都有对hash_set, hash_map, hash_multiset, hash_multimap的支持。

GCC中的hash_map定义在<ext/hash_map>文件,namespace __gnu_cxx中。要定义一个hash_map<int, int>非常简单:

#include <ext/hash_map>
using namespace __gnu_cxx;
hash_map<int, int> hm;

在使用map时,如果我们想要改变元素顺序,或以自定义的struct/class作为key的时候,可以设定map第三个模板参数(默认是less<Key>,即operator<)。对于hash_map,我们需要设定其第三个(hash<Key>)和第四个模板参数(equal_to<Key>, operator==)。

typedef long long my_type;
typedef int any_type;
struct my_hash {
    size_t operator()(const my_type& key) const {
        return (key >> 32) ^ key;
    }
};
struct my_equal_to {
    bool operator()(const my_type& lhs, const my_type& rhs) const {
        return lhs == rhs;
    }
};
hash_map<my_type, any_type, my_hash, my_equal_to> my_hash_map;

对与int等基本类型,系统提供有hash<int>等版本的模板特化,所以只需要指定前两个模板参数就足够了。实现了模板特化的有以下类型

[const] char*, crope, wrope, [signed|unsigned] char, [unsigned] short, [unsigned] int, [unsigned] long

如果需要的话,我们也可以为其他类型实现模板特化

// hash_map<Key, Tp, HashFn=hash<Key>, EqualKey=equal_to<Key>, Alloc=allocator<Tp> >
#include <cstdio>
#include <utility>
#include <hash_map>
using namespace std;
using namespace __gnu_cxx;

namespace __gnu_cxx {
    template<>
    struct hash<pair<int, int> > {
        size_t operator()(const pair<int, int>& key) const {
            return key.first * key.second;
        }
    };
}
hash_map<pair<int, int>, int> hm;

Visual C++的hash_map定义在<hash_map>文件,namespace stdext中,早先在namespace std中。其实现与GCC的不同,模板参数也不一样,比如上面的例子在VC++版本如下

Comments 15 Comments »

昨天的HDOJ第三场月赛中hhanger出了一道非主流的Guess the number。援引官方解题报告:

本题属于非正常题,纯属娱乐。因为本题最多只有16个字符,所以可以用X分提交法来套取输入数据,可以利用的返回结果至少有6种,把字符先统一转化成小写后,基本上两次提交可以确定一个字符,因此可以在期望时间内得到解。

相信很多acmer对利用返回结果来套取输入数据并不陌生,我们经常用这招来获得case数或检验输入数据是否与题目描述不符。下面这段程序可以判断第off个字符在哪个范围内,利用了HDOJ中G++的TLE, MLE, OLE, RE(ACCESS_VIOLATION, STACK_OVERFLOW, DIVIDE_BY_ZERO)和WA七种不同返回结果。但平时编译器对包括尾递归、空循环和常量的优化此时却成了绊脚石,为了生成我们预期的返回结果,只好让代码复杂一点或产生一些副作用。

// author: watashi
#include <cctype>
#include <cstdio>
#include <cstring>

void gao(int ch) {
	if (ch < $_[1]) {	// Time Limit Exceeded
		while (true);
	} else if (ch < $_[2]) { // Memory Limit Exceeded
		char* p = new char[128 << 20];
		memset(p, 0xff, 128 << 20);
	} else if (ch < $_[3]) { // Output Limit Exceeded
		while (true) {
			fputs("[Output Limit Exceeded] (http://watashi.ws/wabots) quick brown fox jumps over the lazy dog", stdout);
		}
	} else if (ch < $_[4]) { // Runtime Error (ACCESS_VIOLATION)
		int p[1 << 10] = {-1};
		putchar(p[1 << 20]);
	} else if (ch < $_[5]) { // Runtime Error (STACK_OVERFLOW)
		gao(ch);
	} else if (ch < $_[6]) { // Runtime Error (INTEGER_DIVIDE_BY_ZERO)
		int p = sizeof(char);
		printf("%d", sizeof(int) / --p);
	} else { // Wrong Answer
		return;
	}
}

int main() {
    int off = $_[0];
    for (int i = 0; i < off; ++i) {
        getchar();
    }
    gao(tolower(getchar()));
	return 0;
}

有了这段程序,理论上就可以在32次内得到输入数据了。但由于人肉提交难免手抖,判断易出差错,而且需要很多的肉,实际次数远在这之上,不少人都提交上百次后才AC。对于又缺少肉,又容易手抖的我,连尝试的勇气都没有。不过,却可以写个从不手抖,有着用不完的肉的机器人来代劳。于是先实现一个HDOJ的自动提交机模块。

# HDOJAgent.pm
package HDOJAgent;
use strict;
use warnings;
use LWP::UserAgent;

my $prefix = "http://acm.hdu.edu.cn";
my $interval = 60;
my $maxretry = 2;

sub new {
    my $class = shift;
    my $self = {
        user => $_[0] || '',
        problemid => $_[1] || 1000,
        language => $_[2] || 0,
        ua => new LWP::UserAgent(
            agent => 'HDOJAgent (http://watashi.ws/wabots)',
            cookie_jar => {},
        )
    };
    bless $self, $class;
    return $self;
}

sub AUTOLOAD {
    my $self = shift;
    my $name = $HDOJAgent::AUTOLOAD;
    $name =~ s/.*://;
    return if $name eq 'DESTROY';
    $self->{$name} = shift if @_;
    return $self->{$name};
}

sub post {
    my ($self, $url, $form) = @_;
    my $ua = $self->ua;
    for (1 .. $maxretry) {
        my $response = $ua->post($url, $form);
        if (!$response->is_error) {
            return $response->decoded_content;
        }
        sleep $interval;
    }
    warn "maxretry exceeded!";
    return undef;
}

sub login {
    my ($self, $pass) = @_;
    $self->post("$prefix/userloginex.php?action=login", {
        username => $self->user,
        userpass => $pass,
        login => 'Sign In'
    });
}

sub submit {
    my ($self, $code) = @_;
    $self->post("$prefix/submit.php?action=submit", {
        problemid => $self->problemid,
        language => $self->language,
        usercode => $code
    });
}

sub laststatus {
    my $self = shift;
    my $user = $self->user;
    while (1) {
        my $_ = $self->post("http://acm.hdu.edu.cn/status.php?user=$user");
        s{^[\s\S]*Pro\.ID.*Exe\.Time.*Exe\.Memory}{}gs;
        s{</td><td><a href="/showproblem\.php\?pid=.*$}{}gs;
        s{^.*<td>}{}gs;
        s{^\s*|\s*|<[^>]*>}{}gs;
        return $_ unless /^$|Queuing|Compiling|Running/;
        sleep $interval;
    }
}

要完成提交操作需要提供cookie,通常有两种办法,一是直接在WebClient.Headers里设置好cookie,以前我用C#写的一个ZOJ的自动提交机就是这么实现的;更简单的办法是给UserAgent初始化一个空的cookie,通过完成login来设置cookie。有了cookie后就可以submit了,submit需要提供problemid, language和usercode。submit后可以通过laststatus来获得你最近一次提交的返回结果。先用A + B Problem来测试一下模块,这里用了caller函数,实现模块的测试和使用两不误。

# HDOJAgent.pm
return 1 if caller;

my $hdoj = new HDOJAgent('wabots');
$hdoj->login('~!@#$%^&*()_+');
$hdoj->problemid(1000); # A + B Problem
$hdoj->language(1); # GCC
$hdoj->submit(<<GCC
main(a,b){while(scanf("%d%d",&a,&b)>0)printf("%d\n",a+b);}
GCC
);
print $hdoj->laststatus, "\n";

最后在wabots.pl中使用HDOJAgent模块,不断通过七分法提交HDU3337,以得到输入数据中的字符,直到EOF。得到的输入数据,答案也就显而易见啦^ ^

#!/usr/bin/perl -w
# http://watashi.ws/wabots

use strict;
use warnings;
use HDOJAgent;

$| = 1;

sub getcpp {
    return <<CPP;
...
CPP
}

sub getpos {
    my ($min, $max, $cnt) = @_;
    my @ret = ();
    $max -= $min;
    for (my $i = 0; $i <= $cnt; ++$i) {
        push @ret, $min + int($max * $i / $cnt);
    }
    return @ret;
}

my @status = qw(Time Memory Output ACCESS STACK INTEGER Wrong);

my @charset = (' ', '0' .. '9', 'a' .. 'z');
@charset = sort {$a <=> $b} map {ord $_} @charset;
unshift @charset, -1;

my $hdoj = new HDOJAgent('wabots', 3337, 0);
$hdoj->login('~!@#$%^&*()_+');

my ($try, $off, $min, $max, $res) = (0, 0, 0, scalar @charset, '');
while (1) {
    ++$try;
    print "wabots# TRY #$try: [$off] in [$min, $max)\n";
    my @pos = getpos($min, $max, scalar @status);
    $hdoj->submit(getcpp($off, @charset[@pos[1 .. $#pos - 1]]));
    my $status = $hdoj->laststatus;
    print "wabots# \t$status\n";
    for (my $i = 0; $i < @status; ++$i) {
        if ($status =~ /$status[$i]/i) {
            $min = $pos[$i];
            $max = $pos[$i + 1];
        }
    }
    if ($min == $max - 1) {
        last if $charset[$min] < 0;
        $res .= chr $charset[$min];
        print "wabots# \t[$off] = $charset[$min] ($res)\n";
        ++$off;
        $min = 0;
        $max = @charset;
    }
    sleep 5;
}
print "RESULT = $res\n";

运行上面的程序,输出的日志如下:

由于文件中包含答案,为防止剧透,您需要输入本题正确答案以获取该文件:

Comments 6 Comments »

原文最初发表于2009年9月18日,并消失于地震

C

/* A + B Problem in C */
#include <stdio.h>

int main(void) {
	int a, b;

	while (scanf("%d%d", &a, &b) != EOF) {
		printf("%d\n", a + b);
	}

	return 0;
}

Comments 7 Comments »